TwinLiteNetPlus: Ein Echtzeit-Multi-Task-Segmentsierungsmodell für autonome Fahrzeuge

Semantische Segmentierung ist für autonome Fahrzeuge von entscheidender Bedeutung, insbesondere für die Aufgaben der Fahrspur- und Fahrflächensegmentierung, da sie Sicherheit und Navigation gewährleisten. Um die hohen Rechenkosten aktueller State-of-the-Art (SOTA)-Modelle zu adressieren, führt dieser Artikel TwinLiteNetPlus ein, ein Modell, das Effizienz und Genauigkeit effektiv ausbalanciert. TwinLiteNetPlus integriert herkömmliche sowie depth-wise separable dilated Convolutionen, wodurch die Komplexität reduziert wird, ohne die hohe Genauigkeit zu beeinträchtigen. Das Modell steht in vier Konfigurationen zur Verfügung – von der robusten Variante TwinLiteNetPlus_{Large} mit 1,94 Millionen Parametern bis hin zur ultraleichten TwinLiteNetPlus_{Nano} mit nur 34.000 Parametern. Besonders hervorzuheben ist, dass TwinLiteNetPlus_{Large} eine mIoU (mean Intersection over Union) von 92,9 % für die Fahrflächensegmentierung und eine IoU von 34,2 % für die Fahrspursegmentierung erreicht. Diese Ergebnisse zeigen herausragende Leistung, übertreffen dabei aktuelle SOTA-Modelle, und erfordern gleichzeitig nur ein 11-fach geringere Anzahl an Floating Point Operations (FLOPs). Rigorose Evaluierungen auf verschiedenen eingebetteten Geräten belegen eine vielversprechende Latenz- und Energieeffizienz, was die hohe Relevanz von TwinLiteNetPlus für praktische Anwendungen in autonomen Fahrzeugen unterstreicht. Der Quellcode ist unter https://github.com/chequanghuy/TwinLiteNetPlus verfügbar.