MonoLSS: Lernfähige Stichprobenauswahl für monokulare 3D-Detektion

Im Bereich des autonomen Fahrens ist die monokulare 3D-Detektion eine wichtige Aufgabe, die darauf abzielt, die 3D-Eigenschaften (Tiefe, Dimension und Orientierung) von Objekten in einem einzelnen RGB-Bild zu schätzen. Frühere Arbeiten haben Merkmale heuristisch verwendet, um 3D-Eigenschaften zu lernen, ohne dabei zu berücksichtigen, dass unangemessene Merkmale negative Auswirkungen haben könnten. In dieser Arbeit wird eine Stichprobenauswahl eingeführt, die besagt, dass nur geeignete Stichproben zur Regression der 3D-Eigenschaften trainiert werden sollten. Um die Stichproben selektiv auszuwählen, schlagen wir ein lernfähiges Stichprobenauswahlmodul (Learnable Sample Selection, LSS) vor, das auf der Gumbel-Softmax-Methode und einem relativen Abstands-Stichprobenteiler basiert. Das LSS-Modul arbeitet unter einer Warm-Up-Strategie, was zu einer Verbesserung der Trainingsstabilität führt. Darüber hinaus entwickeln wir aufgrund der Tatsache, dass das dem 3D-Eigenschaften-Sampling gewidmete LSS-Modul auf objektbasierten Merkmalen beruht, eine Datenverstärkungsmethode namens MixUp3D. Diese Methode bereichert die 3D-Eigenschaften-Stichproben gemäß den Abbildungsprinzipien und vermeidet dabei Ambiguitäten. Als zwei orthogonale Methoden können das LSS-Modul und MixUp3D sowohl unabhängig als auch in Kombination eingesetzt werden. Ausreichende Experimente haben gezeigt, dass ihre gemeinsame Anwendung synergetische Effekte erzielen kann und Verbesserungen hervorbringt, die über die einfache Summe ihrer individuellen Anwendungen hinausgehen. Durch den Einsatz des LSS-Moduls und von MixUp3D erreicht unsere Methode MonoLSS ohne zusätzliche Daten den ersten Platz in allen drei Kategorien (Auto, Radfahrer und Fußgänger) des KITTI 3D-Objekt-Detektionsbenchmarks und erzielt wettbewerbsfähige Ergebnisse sowohl im Waymo-Datensatz als auch bei der Cross-Datensatz-Bewertung von KITTI-nuScenes. Der Code ist im Supplementärmaterial enthalten und wird veröffentlicht, um verwandte akademische und industrielle Studien zu fördern.