HyperAIHyperAI
vor 11 Tagen

HEDNet: Ein hierarchisches Encoder-Decoder-Netzwerk für die 3D-Objekterkennung in Punktwolken

Gang Zhang, Junnan Chen, Guohuan Gao, Jianmin Li, Xiaolin Hu
HEDNet: Ein hierarchisches Encoder-Decoder-Netzwerk für die 3D-Objekterkennung in Punktwolken
Abstract

Die 3D-Objektdetektion in Punktwolken ist für autonome Fahrzeugsysteme von entscheidender Bedeutung. Eine zentrale Herausforderung bei der 3D-Objektdetektion ergibt sich aus der spärlichen Verteilung der Punkte innerhalb der 3D-Szene. Bestehende hochleistungsfähige Methoden verwenden typischerweise 3D-sparse Faltungsneuronale Netze mit kleinen Kerneln zur Merkmalsextraktion. Um die Rechenkosten zu reduzieren, setzen diese Methoden auf Submannigfaltigkeits-sparse Faltungen, die den Informationsaustausch zwischen räumlich getrennten Merkmalen verhindern. Einige neuere Ansätze versuchen, dieses Problem durch die Einführung von großen Kerneln oder Selbst-Attention-Mechanismen zu lösen, erreichen jedoch entweder nur begrenzte Verbesserungen der Genauigkeit oder verursachen übermäßige Rechenkosten. Wir stellen HEDNet vor, ein hierarchisches Encoder-Decoder-Netzwerk für die 3D-Objektdetektion, das Encoder-Decoder-Blöcke nutzt, um langreichweitige Abhängigkeiten zwischen Merkmalen im räumlichen Raum zu erfassen, insbesondere für große und entfernte Objekte. Wir führten umfangreiche Experimente auf den Datensätzen Waymo Open und nuScenes durch. HEDNet erreichte auf beiden Datensätzen eine überlegene Detektionsgenauigkeit im Vergleich zu früheren state-of-the-art-Methoden bei gleichzeitig wettbewerbsfähiger Effizienz. Der Quellcode ist unter https://github.com/zhanggang001/HEDNet verfügbar.

HEDNet: Ein hierarchisches Encoder-Decoder-Netzwerk für die 3D-Objekterkennung in Punktwolken | Neueste Forschungsarbeiten | HyperAI