HyperAIHyperAI
vor 9 Tagen

Kategoriensensible dynamische Label-Zuweisung mit hochwertigen vorgeschlagenen Regionen

Mingkui Feng, Hancheng Yu, Xiaoyu Dang, Ming Zhou
Kategoriensensible dynamische Label-Zuweisung mit hochwertigen vorgeschlagenen Regionen
Abstract

Objekte in Luftbildern sind typischerweise in komplexen Hintergründen eingebettet und weisen beliebige Orientierungen auf. Bei der Verwendung orientierter Achsenparalleler Rechtecke (OBB) zur Darstellung beliebig orientierter Objekte kann die Periodizität von Winkeln zu Diskontinuitäten in den Label-Regressionswerten an den Grenzen führen, was sprunghafte Schwankungen in der Verlustfunktion verursacht. Um dieses Problem zu lösen, wird in dem orientierten Detektionsframework eine OBB-Darstellung basierend auf der komplexen Ebene eingeführt, sowie eine trigonometrische Verlustfunktion vorgeschlagen. Darüber hinaus wird unter Ausnutzung vorheriger Kenntnisse über komplexe Hintergrundumgebungen und signifikante Unterschiede bei großen Objekten in Luftbildern ein Conformer-RPN-Kopf entwickelt, um Winkelinformationen vorherzusagen. Die vorgeschlagene Verlustfunktion und der Conformer-RPN-Kopf erzeugen gemeinsam hochwertige orientierte Vorschläge. Zudem wird ein kategorienbewusster dynamischer Label-Zuweisungsansatz basierend auf vorhergesagten Kategorien vorgeschlagen, um die Beschränkungen einer reinen Abhängigkeit von IoU bei der Vorschlagslabel-Zuweisung zu überwinden. Diese Methode führt zu repräsentativeren negativen Stichproben und gewährleistet eine Konsistenz zwischen Klassifikations- und Regressionsmerkmalen. Experimente wurden auf vier realistischen orientierten Detektions-Datensätzen durchgeführt, wobei die Ergebnisse eine überlegene Leistung bei der orientierten Objekterkennung mit minimalen Anpassungsaufwand und geringen Zeitkosten zeigen. Speziell wurden mAP-Werte von 82,02 %, 71,99 %, 69,87 % und 98,77 % auf den Datensätzen DOTA-v1.0, DOTA-v1.5, DIOR-R und HRSC2016 erreicht.