HyperAIHyperAI
vor 3 Monaten

Projizieren von Punkten auf Achsen: Orientierte Objektdetektion mittels Punkts-Achsen-Darstellung

Zeyang Zhao, Qilong Xue, Yuhang He, Yifan Bai, Xing Wei, Yihong Gong
Projizieren von Punkten auf Achsen: Orientierte Objektdetektion mittels Punkts-Achsen-Darstellung
Abstract

Diese Arbeit stellt die Punkt-Achse-Darstellung für die orientierte Objektdetektion vor, die durch ihre Flexibilität und geometrisch intuitive Struktur gekennzeichnet ist und zwei zentrale Komponenten umfasst: Punkte und Achsen. 1) Punkte beschreiben den räumlichen Umfang und die Konturen von Objekten und liefern detaillierte Formbeschreibungen. 2) Achsen definieren die primären Richtungsrichtungen von Objekten und liefern entscheidende Orientierungshinweise, die für eine präzise Detektion unerlässlich sind. Die Punkt-Achse-Darstellung trennt Ort und Rotation voneinander und löst so das Problem der Diskontinuität bei der Verlustfunktion, das bei herkömmlichen Ansätzen auf Basis von Achsenparallelen Rechtecken häufig auftritt. Um eine effektive Optimierung ohne zusätzliche Annotationen zu ermöglichen, schlagen wir die Max-Projektionsverlustfunktion zur Überwachung des Lernens von Punkt-Mengen und den Cross-Achsen-Verlust für eine robuste Lernstrategie der Achsendarstellung vor. Darüber hinaus präsentieren wir auf Basis dieser Darstellung das Oriented DETR-Modell, das nahtlos in den DETR-Framework integriert ist, um präzise Punkt-Achse-Vorhersagen und eine end-to-end-Objektdetektion zu ermöglichen. Experimentelle Ergebnisse zeigen erhebliche Leistungssteigerungen bei Aufgaben der orientierten Objektdetektion.