HyperAIHyperAI
vor 2 Monaten

Gemeinsame 3D-Vorschlagsgenerierung und Objekterkennung durch Ansichtsaggregation

Jason Ku; Melissa Mozifian; Jungwook Lee; Ali Harakeh; Steven Waslander
Gemeinsame 3D-Vorschlagsgenerierung und Objekterkennung durch Ansichtsaggregation
Abstract

Wir stellen AVOD vor, ein Netzwerk zur Erkennung von Aggregatansichten-Objekten für autonome Fahrzeugszenarien. Die vorgeschlagene neuronale Netzarchitektur verwendet LIDAR-Punktwolken und RGB-Bilder, um Merkmale zu generieren, die von zwei Unter网路共享:一个区域提议网络(RPN)和一个第二阶段检测网络。为了纠正上述句子中的语言错误并保持一致性,正确的德语翻译如下:Wir präsentieren AVOD, ein Aggregierte Ansicht Objekt-Erkennungsnetzwerk für autonome Fahrzeugszenarien. Die vorgeschlagene Neuronale Netzarchitektur nutzt LIDAR-Punktwolken und RGB-Bilder, um Merkmalskarten zu erzeugen, die von zwei Unter-Netzwerken geteilt werden: einem Region Proposal Network (RPN) und einem zweistufigen Detektionsnetzwerk. Der vorgeschlagene RPN verwendet eine neuartige Architektur, die in der Lage ist, Multimodalitätsmerkmalsfusion auf hochaufgelösten Merkmalskarten durchzuführen, um verlässliche 3D-Objektvorschläge für mehrere Objektklassen in Straßenbildern zu generieren. Mit diesen Vorschlägen führt das zweistufige Detektionsnetzwerk eine genaue orientierte 3D-Bounding-Box-Regressierung und Klassifikation durch, um die Ausdehnung, Orientierung und Klassifizierung von Objekten im dreidimensionalen Raum vorherzusagen. Unsere vorgeschlagene Architektur erzielt nachgewiesenermaßen erstklassige Ergebnisse bei der KITTI 3D-Objekt-Erkennungsbenchmarks während sie in Echtzeit mit geringem Speicherbedarf läuft, was sie als geeigneten Kandidaten für den Einsatz in autonomen Fahrzeugen macht. Der Quellcode ist unter folgender URL verfügbar: https://github.com/kujason/avod