HyperAIHyperAI

Command Palette

Search for a command to run...

BEVDepth: Erwerb zuverlässiger Tiefeninformationen für die Multiview-3D-Objekterkennung

Yinhao Li Zheng Ge Guanyi Yu Jinrong Yang Zengran Wang Yukang Shi Jianjian Sun Zeming Li

Zusammenfassung

In dieser Forschung stellen wir einen neuen 3D-Objektdetektor mit vertrauenswürdiger Tiefenschätzung vor, der BEVDepth genannt wird, für die kamerabasierte Bird’s-Eye-View (BEV)-3D-Objektdetektion. Unsere Arbeit basiert auf einer zentralen Beobachtung: Die Tiefenschätzung in aktuellen Ansätzen ist, gegeben die entscheidende Rolle der Tiefeninformation für die kamerabasierte 3D-Detektion, erstaunlich unzureichend. BEVDepth löst dieses Problem durch die Nutzung einer expliziten Tiefenüberwachung. Zudem wird ein kamerabewusstes Tiefenschätzungsmodul eingeführt, um die Fähigkeit zur Tiefenschätzung zu verbessern. Darüber hinaus entwickeln wir ein neuartiges Tiefenverfeinerungsmodul, um die negativen Auswirkungen ungenauer Feature-Unprojection zu kompensieren. Unterstützt durch ein maßgeschneidertes effizientes Voxel-Pooling und ein Mehrframe-Mechanismus erreicht BEVDepth auf dem anspruchsvollen nuScenes-Testset eine neue State-of-the-Art-Performance von 60,9 % NDS, wobei hohe Effizienz beibehalten wird. Zum ersten Mal erreicht ein kamerabasierter Modell eine NDS-Score von 60 %.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
BEVDepth: Erwerb zuverlässiger Tiefeninformationen für die Multiview-3D-Objekterkennung | Paper | HyperAI