Few-Shot Objekterkennung durch Merkmalsgewichtung

Die konventionelle Ausbildung eines tiefen CNN-basierten Objekterkenners erfordert eine große Anzahl von Annotationen von Begrenzungsrahmen, die für seltene Kategorien möglicherweise nicht verfügbar sind. In dieser Arbeit entwickeln wir einen Few-Shot-Objekterkennungsalgorithmus, der in der Lage ist, neue Objekte aus nur wenigen annotierten Beispielen zu erkennen. Unser vorgeschlagenes Modell nutzt vollständig beschriftete Basisklassen und passt sich schnell auf neue Klassen an, indem es innerhalb einer einstufigen Erkennungsarchitektur einen Meta-Feature-Lerner und ein Neugewichtungsmodul verwendet. Der Feature-Lerner extrahiert Meta-Features, die allgemein anwendbar sind, um neue Objektklassen zu erkennen, wobei er Trainingsdaten von Basisklassen mit ausreichend vielen Beispielen verwendet. Das Neugewichtungsmodul transformiert wenige Unterstützungsexemplare aus den neuen Klassen in einen globalen Vektor, der die Bedeutung oder Relevanz der Meta-Features für die Erkennung der entsprechenden Objekte angibt. Diese beiden Module zusammen mit einem Erkennungsvorhersagemodul werden unter Verwendung eines episodischen Few-Shot-Lernschemas und einer sorgfältig gestalteten Verlustfunktion end-to-end trainiert. Durch umfangreiche Experimente zeigen wir, dass unser Modell bei der Few-Shot-Objekterkennung in mehreren Datensätzen und Einstellungen deutlich über etablierte Baseline-Methoden hinausgeht. Wir präsentieren auch Analysen verschiedener Aspekte unseres vorgeschlagenen Modells, um Inspiration für zukünftige Few-Shot-Erkennungsarbeiten zu bieten.