HyperAIHyperAI

Command Palette

Search for a command to run...

Look-into-Object: Selbstüberwachte Strukturmodellierung für Objekterkennung

Mohan Zhou extsuperscript1,2* Yalong Bai extsuperscript2* Wei Zhang extsuperscript2† Tiejun Zhao extsuperscript1 Tao Mei extsuperscript2

Zusammenfassung

Die meisten Ansätze zur Objekterkennung konzentrieren sich hauptsächlich auf das Lernen diskriminativer visueller Muster, während sie die holistische Objektstruktur vernachlässigen. Obwohl die Strukturbildung wichtig ist, erfordert sie in der Regel erhebliche manuelle Annotationen und ist daher arbeitsintensiv. In dieser Arbeit schlagen wir vor, den „Blick ins Objekt“ (explizit und intrinsisch die Objektstruktur zu modellieren) durch die Einbeziehung von Selbstüberwachungen in das traditionelle Framework zu ermöglichen. Wir zeigen, dass der Erkennungsbackbone durch diese Methode erheblich verbessert werden kann, um eine robusteres Repräsentationslernen zu ermöglichen, ohne zusätzliche Annotationen oder Verzögerungen bei der Inferenzgeschwindigkeit zu verursachen.Speziell schlagen wir zunächst ein Modul für das Lernen des Objektumfangs vor, das dazu dient, das Objekt basierend auf den visuellen Mustern zu lokalisieren, die unter Instanzen der gleichen Kategorie geteilt werden. Anschließend entwickeln wir ein Modul für das Lernen des räumlichen Kontexts, um die internen Strukturen des Objekts durch die Vorhersage relativer Positionen innerhalb des Umfangs zu modellieren. Diese beiden Module können während des Trainings leicht in beliebige Backbone-Netze integriert und bei der Inferenz wieder entfernt werden.Ausführliche Experimente zeigen, dass unser Ansatz „Blick ins Objekt“ (Look Into Object, LIO) auf einer Reihe von Benchmarks erhebliche Leistungsverbesserungen erzielt, darunter generische Objekterkennungsaufgaben (ImageNet) und feingranulierte Objekterkennungsaufgaben (CUB, Autos, Flugzeuge). Wir demonstrieren außerdem, dass dieses Lernparadigma hochgradig übertragbar auf andere Aufgaben wie Objektdetektion und -segmentierung (MS COCO) ist. Projektseite: https://github.com/JDAI-CV/LIO.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Look-into-Object: Selbstüberwachte Strukturmodellierung für Objekterkennung | Paper | HyperAI