HyperAIHyperAI
vor 11 Tagen

Jenseits des Max-Margin: Klassen-Margin-Gleichgewicht für Few-shot-Objektdetektion

Bohao Li, Boyu Yang, Chang Liu, Feng Liu, Rongrong Ji, Qixiang Ye
Jenseits des Max-Margin: Klassen-Margin-Gleichgewicht für Few-shot-Objektdetektion
Abstract

Few-shot-Objektdetektion hat erhebliche Fortschritte gemacht, indem sie Objekte neuer Klassen mittels der Merkmalsdarstellung darstellt, die auf einer Menge von Basisklassen gelernt wurde. Allerdings wird ein impliziter Widerspruch zwischen der Klassifikation neuer Klassen und deren Darstellung leider übersehen. Einerseits ist zur genauen Klassifikation neuer Klassen eine starke Trennung der Verteilungen zweier Basisklassen erforderlich (Max-Margin-Prinzip). Andererseits sollten die Verteilungen der Basisklassen jedoch eng beieinander liegen, um die intra-klassische Distanz neuer Klassen zu minimieren und deren Rekonstruktion präzise zu gestalten (Min-Margin-Prinzip). In diesem Artikel stellen wir einen Ansatz namens Class Margin Equilibrium (CME) vor, der darauf abzielt, sowohl die Aufteilung des Merkmalsraums als auch die Rekonstruktion neuer Klassen systematisch zu optimieren. CME transformiert zunächst das Few-shot-Detektionsproblem in ein Few-shot-Klassifikationsproblem, indem ein vollständig verbundener Layer zur Entkoppelung von Lokalisationsmerkmalen eingesetzt wird. Anschließend schafft CME durch Einführung einer einfachen, aber wirksamen Margin-Loss-Funktion während des Merkmalslernens ausreichend Abstandsräume für neue Klassen. Schließlich strebt CME eine Gleichgewichtslage der Margin an, indem es die Merkmale von Instanzen neuer Klassen adversarisch im Min-Max-Sinne stört. Experimente auf den Datensätzen Pascal VOC und MS-COCO zeigen, dass CME zwei Baseline-Detektoren signifikant übertrifft (bis zu 3–5 % Steigerung im Durchschnitt) und eine state-of-the-art-Leistung erreicht. Der Quellcode ist unter https://github.com/Bohao-Lee/CME verfügbar.

Jenseits des Max-Margin: Klassen-Margin-Gleichgewicht für Few-shot-Objektdetektion | Neueste Forschungsarbeiten | HyperAI