HyperAIHyperAI
vor 9 Tagen

Ein einfacher episodischer linearer Probe verbessert die visuelle Erkennung in der Wildnis

{Yi Yang, Xiaohan Wang, Linchao Zhu, Yuanzhi Liang}
Ein einfacher episodischer linearer Probe verbessert die visuelle Erkennung in der Wildnis
Abstract

Die Verständnis von Netzwerk-Verallgemeinerung und Merkmalsunterscheidbarkeit stellt ein offenes Forschungsproblem im Bereich der visuellen Erkennung dar. Zahlreiche Studien wurden unternommen, um die Qualität von Merkmalsrepräsentationen zu bewerten. Eine der einfachen Strategien besteht darin, einen linearen Probing-Klassifikator einzusetzen, um die Klassifiziergenauigkeit unter den gewonnenen Merkmalen quantitativ zu evaluieren. Der typische lineare Probing-Klassifikator wird üblicherweise lediglich als Ersatzmodell zur Inferenzzeit verwendet, während seine Wirksamkeit bei der Messung der Eignung der Merkmale für die lineare Klassifikation während des Trainings weitgehend vernachlässigt wird. In diesem Paper stellen wir einen episodischen linearen Probing-Klassifikator (Episodic Linear Probing, ELP) vor, der die Verallgemeinerung visueller Repräsentationen in Echtzeit widerspiegelt. ELP wird mit abgetrennten Merkmalen aus dem Netzwerk trainiert und episodisch neu initialisiert. Er verdeutlicht die Unterscheidbarkeit der visuellen Repräsentationen während des Trainings. Anschließend wird eine ELP-geeignete Regularisierungsterm (ELP-Suitable Regularization, ELP-SR) eingeführt, um die Abstände zwischen den Wahrscheinlichkeitsverteilungen des ELP-Klassifikators und des Hauptklassifikators zu erfassen. ELP-SR nutzt einen neu skalierten Faktor, um jedes Beispiel während des Trainings zu regularisieren, wodurch die Verlustfunktion adaptiv moduliert und die Merkmale gleichzeitig unterscheidbar und verallgemeinerungsfähig gefördert werden. Wir beobachten signifikante Verbesserungen in drei realen Aufgaben der visuellen Erkennung, darunter feinabgestimmte visuelle Klassifikation, langschwänzige visuelle Erkennung sowie generische Objekterkennung. Die erzielten Leistungssteigerungen belegen die Wirksamkeit unseres Ansatzes zur Verbesserung der Netzwerk-Verallgemeinerung und Merkmalsunterscheidbarkeit.