HyperAIHyperAI

Command Palette

Search for a command to run...

V2X-AHD: Fahrzeug-zu-Alles-Zusammenarbeit zur Wahrnehmung mittels asymmetrischem heterogenem Distillation-Netzwerk

Caizhen He Hai Wang Long Chen Tong Luo Yingfeng Cai

Zusammenfassung

Objekterkennung ist das zentrale Thema intelligenter Verkehrssysteme, und die jüngsten Fortschritte in der 3D-Objekterkennung auf Basis von Einzelvehikel-LiDAR zeigen, dass diese präzise Positionsdaten für intelligente Agenten bereitstellen kann, um Entscheidungen zu treffen und Planungen durchzuführen. Im Vergleich zur Einzelvehikel-Wahrnehmung besitzt die kooperative Mehransichtswahrnehmung zwischen Fahrzeug und Infrastruktur grundlegende Vorteile, wie die Beseitigung von Totwinkeln und eine erweiterte Wahrnehmungsdistanz, und ist somit zu einem Forschungsschwerpunkt geworden. Allerdings konzentriert sich die aktuelle Kooperationswahrnehmung hauptsächlich auf die Verbesserung der Komplexität der Datenschmelzung, während die grundlegenden Probleme, die durch den Fehlen von Einzelansichts-Umrissen verursacht werden, vernachlässigt werden. Um die Erkennungsfähigkeit, insbesondere die Vorhersage der Fahrzeugform, zu verbessern, schlagen wir ein Mehransichts-Fahrzeug-Infrastruktur-Kooperationswahrnehmungssystem namens Vehicle-to-Everything Cooperative Perception (V2X-AHD) vor. Zunächst stellen wir ein asymmetrisches heterogenes Distillation-Netzwerk vor, das mit unterschiedlichen Trainingsdaten gespeist wird, um die Genauigkeit der Umrisserkennung zu erhöhen, wobei Mehransichts-Teacher-Features auf Einzelansichts-Student-Features übertragen werden. Da LiDAR-Punktwolken oft spärlich sind, führen wir Spara Pillar ein – einen sparsamen, convolutional-basierten Plug-in-Feature-Extraktions-Backbone – ein, um die Anzahl der Parameter zu reduzieren und die Fähigkeit zur Feature-Extraktion zu verbessern und zu stärken. Darüber hinaus nutzen wir Multi-Head Self-Attention (MSA), um die Einzelansichts-Features zu fusionieren, wobei die leichte Architektur eine glatte und effiziente Darstellung der fusionierten Features ermöglicht. Die Anwendung unseres Algorithmus auf das große offene Datenset V2Xset zeigt, dass unsere Methode Ergebnisse auf dem Stand der Technik erzielt. Laut dieser Studie kann V2X-AHD die Genauigkeit der 3D-Objekterkennung effektiv steigern und gleichzeitig die Anzahl der Netzwerkparameter reduzieren, wodurch es als Benchmark für kooperative Wahrnehmung dient. Der Quellcode dieses Artikels ist unter https://github.com/feeling0414-lab/V2X-AHD verfügbar.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
V2X-AHD: Fahrzeug-zu-Alles-Zusammenarbeit zur Wahrnehmung mittels asymmetrischem heterogenem Distillation-Netzwerk | Paper | HyperAI