SIRA: Skalierbare Inter-Frame-Beziehungen und -Assoziationen für Radar-Wahrnehmung

Konventionelle Radar-Feature-Extraktion steht vor Herausforderungen aufgrund der geringen räumlichen Auflösung, des Rauschens, der Mehrfachreflexion, der Anwesenheit von Geisterzielen und der Bewegungsunschärfe. Diese Einschränkungen können durch nichtlineare Objektbewegungen, insbesondere aus einer egozentrischen Perspektive, verstärkt werden. Es zeigt sich, dass die Überwindung dieser Herausforderungen darin besteht, zeitliche Feature-Beziehungen über einen erweiterten Horizont zu nutzen und die räumliche Bewegungskonsistenz für eine effektive Zuordnung zu gewährleisten. Hierzu schlägt dieser Artikel SIRA (Scalable Inter-frame Relation and Association) mit zwei Design-Ansätzen vor. Erstens, inspiriert durch den Swin Transformer, führen wir erweiterte zeitliche Beziehungen ein und verallgemeinern die bestehende zeitliche Beziehungsschicht von zwei aufeinanderfolgenden Bildern zu mehreren Zwischenbildern mit zeitlich regroupiertem Fensteraufmerksamkeit zur Skalierbarkeit. Zweitens schlagen wir eine Bewegungskonsistenzspur vor, die auf dem Konzept eines Pseudo-Tracklets basiert, das aus Beobachtungsdaten generiert wird, um bessere Trajektorienprognosen und nachfolgende Objektzuordnungen zu ermöglichen. Unser Ansatz erreicht 58,11 mAP@0,5 für orientierte Objekterkennung und 47,79 MOTA für die Verfolgung mehrerer Objekte im Radiate-Datensatz, wobei er den bisherigen Stand der Technik jeweils um +4,11 mAP@0,5 und +9,94 MOTA übertrifft.