HyperAIHyperAI
vor 11 Tagen

V2X-AHD: Fahrzeug-zu-Alles-Zusammenarbeit zur Wahrnehmung mittels asymmetrischem heterogenem Distillation-Netzwerk

Caizhen He, Hai Wang, Long Chen, Tong Luo, Yingfeng Cai
V2X-AHD: Fahrzeug-zu-Alles-Zusammenarbeit zur Wahrnehmung mittels asymmetrischem heterogenem Distillation-Netzwerk
Abstract

Objekterkennung ist das zentrale Thema intelligenter Verkehrssysteme, und die jüngsten Fortschritte in der 3D-Objekterkennung auf Basis von Einzelvehikel-LiDAR zeigen, dass diese präzise Positionsdaten für intelligente Agenten bereitstellen kann, um Entscheidungen zu treffen und Planungen durchzuführen. Im Vergleich zur Einzelvehikel-Wahrnehmung besitzt die kooperative Mehransichtswahrnehmung zwischen Fahrzeug und Infrastruktur grundlegende Vorteile, wie die Beseitigung von Totwinkeln und eine erweiterte Wahrnehmungsdistanz, und ist somit zu einem Forschungsschwerpunkt geworden. Allerdings konzentriert sich die aktuelle Kooperationswahrnehmung hauptsächlich auf die Verbesserung der Komplexität der Datenschmelzung, während die grundlegenden Probleme, die durch den Fehlen von Einzelansichts-Umrissen verursacht werden, vernachlässigt werden. Um die Erkennungsfähigkeit, insbesondere die Vorhersage der Fahrzeugform, zu verbessern, schlagen wir ein Mehransichts-Fahrzeug-Infrastruktur-Kooperationswahrnehmungssystem namens Vehicle-to-Everything Cooperative Perception (V2X-AHD) vor. Zunächst stellen wir ein asymmetrisches heterogenes Distillation-Netzwerk vor, das mit unterschiedlichen Trainingsdaten gespeist wird, um die Genauigkeit der Umrisserkennung zu erhöhen, wobei Mehransichts-Teacher-Features auf Einzelansichts-Student-Features übertragen werden. Da LiDAR-Punktwolken oft spärlich sind, führen wir Spara Pillar ein – einen sparsamen, convolutional-basierten Plug-in-Feature-Extraktions-Backbone – ein, um die Anzahl der Parameter zu reduzieren und die Fähigkeit zur Feature-Extraktion zu verbessern und zu stärken. Darüber hinaus nutzen wir Multi-Head Self-Attention (MSA), um die Einzelansichts-Features zu fusionieren, wobei die leichte Architektur eine glatte und effiziente Darstellung der fusionierten Features ermöglicht. Die Anwendung unseres Algorithmus auf das große offene Datenset V2Xset zeigt, dass unsere Methode Ergebnisse auf dem Stand der Technik erzielt. Laut dieser Studie kann V2X-AHD die Genauigkeit der 3D-Objekterkennung effektiv steigern und gleichzeitig die Anzahl der Netzwerkparameter reduzieren, wodurch es als Benchmark für kooperative Wahrnehmung dient. Der Quellcode dieses Artikels ist unter https://github.com/feeling0414-lab/V2X-AHD verfügbar.

V2X-AHD: Fahrzeug-zu-Alles-Zusammenarbeit zur Wahrnehmung mittels asymmetrischem heterogenem Distillation-Netzwerk | Neueste Forschungsarbeiten | HyperAI