HyperAIHyperAI

Command Palette

Search for a command to run...

MonoLSS: Lernfähige Stichprobenauswahl für monokulare 3D-Detektion

Li Zhenjia ; Jia Jinrang ; Shi Yifeng

Zusammenfassung

Im Bereich des autonomen Fahrens ist die monokulare 3D-Detektion eine wichtige Aufgabe, die darauf abzielt, die 3D-Eigenschaften (Tiefe, Dimension und Orientierung) von Objekten in einem einzelnen RGB-Bild zu schätzen. Frühere Arbeiten haben Merkmale heuristisch verwendet, um 3D-Eigenschaften zu lernen, ohne dabei zu berücksichtigen, dass unangemessene Merkmale negative Auswirkungen haben könnten. In dieser Arbeit wird eine Stichprobenauswahl eingeführt, die besagt, dass nur geeignete Stichproben zur Regression der 3D-Eigenschaften trainiert werden sollten. Um die Stichproben selektiv auszuwählen, schlagen wir ein lernfähiges Stichprobenauswahlmodul (Learnable Sample Selection, LSS) vor, das auf der Gumbel-Softmax-Methode und einem relativen Abstands-Stichprobenteiler basiert. Das LSS-Modul arbeitet unter einer Warm-Up-Strategie, was zu einer Verbesserung der Trainingsstabilität führt. Darüber hinaus entwickeln wir aufgrund der Tatsache, dass das dem 3D-Eigenschaften-Sampling gewidmete LSS-Modul auf objektbasierten Merkmalen beruht, eine Datenverstärkungsmethode namens MixUp3D. Diese Methode bereichert die 3D-Eigenschaften-Stichproben gemäß den Abbildungsprinzipien und vermeidet dabei Ambiguitäten. Als zwei orthogonale Methoden können das LSS-Modul und MixUp3D sowohl unabhängig als auch in Kombination eingesetzt werden. Ausreichende Experimente haben gezeigt, dass ihre gemeinsame Anwendung synergetische Effekte erzielen kann und Verbesserungen hervorbringt, die über die einfache Summe ihrer individuellen Anwendungen hinausgehen. Durch den Einsatz des LSS-Moduls und von MixUp3D erreicht unsere Methode MonoLSS ohne zusätzliche Daten den ersten Platz in allen drei Kategorien (Auto, Radfahrer und Fußgänger) des KITTI 3D-Objekt-Detektionsbenchmarks und erzielt wettbewerbsfähige Ergebnisse sowohl im Waymo-Datensatz als auch bei der Cross-Datensatz-Bewertung von KITTI-nuScenes. Der Code ist im Supplementärmaterial enthalten und wird veröffentlicht, um verwandte akademische und industrielle Studien zu fördern.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
MonoLSS: Lernfähige Stichprobenauswahl für monokulare 3D-Detektion | Paper | HyperAI