HyperAIHyperAI
vor 16 Tagen

IAFA: Instance-aware Feature Aggregation für die 3D-Objekterkennung aus einer einzigen Bildaufnahme

Dingfu Zhou, Xibin Song, Yuchao Dai, Junbo Yin, Feixiang Lu, Jin Fang, Miao Liao, Liangjun Zhang
IAFA: Instance-aware Feature Aggregation für die 3D-Objekterkennung aus einer einzigen Bildaufnahme
Abstract

Die 3D-Objekterkennung aus einer einzigen Bildaufnahme ist eine zentrale Aufgabe im Bereich des autonomen Fahrens (AD), für die verschiedene Ansätze vorgeschlagen wurden. Allerdings ist diese Aufgabe inhärent mehrdeutig und herausfordernd, da die Schätzung der Tiefeninformation aus einer einzigen Bildaufnahme bereits ein schlecht gestelltes Problem darstellt. In diesem Artikel präsentieren wir einen instanzbewussten Ansatz zur Aggregation nützlicher Informationen, um die Genauigkeit der 3D-Objekterkennung zu verbessern, mit folgenden Beiträgen: Erstens wird ein instanzbewusstes Merkmalsaggregationsmodul (IAFA) vorgeschlagen, das lokale und globale Merkmale zur Regressionsberechnung von 3D-Bounding-Boxes sammelt. Zweitens stellen wir empirisch fest, dass das räumliche Aufmerksamkeitsmodul gut gelernt werden kann, wenn man grobe Instanzannotierungen als Überwachungssignal verwendet. Das vorgeschlagene Modul hat die Leistung der Baseline-Methode sowohl bei der 3D-Objekterkennung als auch bei der 2D-Top-Down-Sicht der Fahrzeugerkennung in allen drei Kategorien signifikant verbessert. Drittens erreicht unser vorgeschlagener Ansatz die beste Leistung aller bisherigen Methoden, die auf einer einzigen Bildaufnahme basieren (einschließlich solcher, die mit Tiefeninformation als Hilfsinput trainiert wurden), und erzielt eine state-of-the-art-Leistung bei der 3D-Objekterkennung auf dem KITTI-Benchmark.

IAFA: Instance-aware Feature Aggregation für die 3D-Objekterkennung aus einer einzigen Bildaufnahme | Neueste Forschungsarbeiten | HyperAI