Command Palette
Search for a command to run...
BEVDepth: Erwerb zuverlässiger Tiefeninformationen für die Multiview-3D-Objekterkennung
BEVDepth: Erwerb zuverlässiger Tiefeninformationen für die Multiview-3D-Objekterkennung
Yinhao Li Zheng Ge Guanyi Yu Jinrong Yang Zengran Wang Yukang Shi Jianjian Sun Zeming Li
Zusammenfassung
In dieser Forschung stellen wir einen neuen 3D-Objektdetektor mit vertrauenswürdiger Tiefenschätzung vor, der BEVDepth genannt wird, für die kamerabasierte Bird’s-Eye-View (BEV)-3D-Objektdetektion. Unsere Arbeit basiert auf einer zentralen Beobachtung: Die Tiefenschätzung in aktuellen Ansätzen ist, gegeben die entscheidende Rolle der Tiefeninformation für die kamerabasierte 3D-Detektion, erstaunlich unzureichend. BEVDepth löst dieses Problem durch die Nutzung einer expliziten Tiefenüberwachung. Zudem wird ein kamerabewusstes Tiefenschätzungsmodul eingeführt, um die Fähigkeit zur Tiefenschätzung zu verbessern. Darüber hinaus entwickeln wir ein neuartiges Tiefenverfeinerungsmodul, um die negativen Auswirkungen ungenauer Feature-Unprojection zu kompensieren. Unterstützt durch ein maßgeschneidertes effizientes Voxel-Pooling und ein Mehrframe-Mechanismus erreicht BEVDepth auf dem anspruchsvollen nuScenes-Testset eine neue State-of-the-Art-Performance von 60,9 % NDS, wobei hohe Effizienz beibehalten wird. Zum ersten Mal erreicht ein kamerabasierter Modell eine NDS-Score von 60 %.