vor 8 Monaten

Mohan Zhou extsuperscript1,2* Yalong Bai extsuperscript2* Wei Zhang extsuperscript2† Tiejun Zhao extsuperscript1 Tao Mei extsuperscript2

Zusammenfassung

Die meisten Ansätze zur Objekterkennung konzentrieren sich hauptsächlich auf das Lernen diskriminativer visueller Muster, während sie die holistische Objektstruktur vernachlässigen. Obwohl die Strukturbildung wichtig ist, erfordert sie in der Regel erhebliche manuelle Annotationen und ist daher arbeitsintensiv. In dieser Arbeit schlagen wir vor, den „Blick ins Objekt“ (explizit und intrinsisch die Objektstruktur zu modellieren) durch die Einbeziehung von Selbstüberwachungen in das traditionelle Framework zu ermöglichen. Wir zeigen, dass der Erkennungsbackbone durch diese Methode erheblich verbessert werden kann, um eine robusteres Repräsentationslernen zu ermöglichen, ohne zusätzliche Annotationen oder Verzögerungen bei der Inferenzgeschwindigkeit zu verursachen.Speziell schlagen wir zunächst ein Modul für das Lernen des Objektumfangs vor, das dazu dient, das Objekt basierend auf den visuellen Mustern zu lokalisieren, die unter Instanzen der gleichen Kategorie geteilt werden. Anschließend entwickeln wir ein Modul für das Lernen des räumlichen Kontexts, um die internen Strukturen des Objekts durch die Vorhersage relativer Positionen innerhalb des Umfangs zu modellieren. Diese beiden Module können während des Trainings leicht in beliebige Backbone-Netze integriert und bei der Inferenz wieder entfernt werden.Ausführliche Experimente zeigen, dass unser Ansatz „Blick ins Objekt“ (Look Into Object, LIO) auf einer Reihe von Benchmarks erhebliche Leistungsverbesserungen erzielt, darunter generische Objekterkennungsaufgaben (ImageNet) und feingranulierte Objekterkennungsaufgaben (CUB, Autos, Flugzeuge). Wir demonstrieren außerdem, dass dieses Lernparadigma hochgradig übertragbar auf andere Aufgaben wie Objektdetektion und -segmentierung (MS COCO) ist. Projektseite: https://github.com/JDAI-CV/LIO.

Quell-PDF Code anzeigen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

vor 8 Monaten

Mohan Zhou extsuperscript1,2* Yalong Bai extsuperscript2* Wei Zhang extsuperscript2† Tiejun Zhao extsuperscript1 Tao Mei extsuperscript2

Zusammenfassung

Quell-PDF Code anzeigen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

vor 8 Monaten

Mohan Zhou extsuperscript1,2* Yalong Bai extsuperscript2* Wei Zhang extsuperscript2† Tiejun Zhao extsuperscript1 Tao Mei extsuperscript2

Zusammenfassung

Quell-PDF Code anzeigen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Look-into-Object: Selbstüberwachte Strukturmodellierung für Objekterkennung | Paper | HyperAI

Command Palette

Look-into-Object: Selbstüberwachte Strukturmodellierung für Objekterkennung

Mohan Zhou extsuperscript1,2* Yalong Bai extsuperscript2* Wei Zhang extsuperscript2† Tiejun Zhao extsuperscript1 Tao Mei extsuperscript2

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Look-into-Object: Selbstüberwachte Strukturmodellierung für Objekterkennung

Mohan Zhou extsuperscript1,2* Yalong Bai extsuperscript2* Wei Zhang extsuperscript2† Tiejun Zhao extsuperscript1 Tao Mei extsuperscript2

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Look-into-Object: Selbstüberwachte Strukturmodellierung für Objekterkennung

Mohan Zhou extsuperscript1,2* Yalong Bai extsuperscript2* Wei Zhang extsuperscript2† Tiejun Zhao extsuperscript1 Tao Mei extsuperscript2

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters