Dynamisches feinkörniges Lernen von grob nach fein für ausgerichtete winzige Objektdetektion

Die Erkennung beliebig ausgerichteter winziger Objekte stellt für bestehende Detektoren erhebliche Herausforderungen dar, insbesondere im Hinblick auf die Zuordnung von Etiketten. Trotz der Untersuchung adaptiver Etikettenzuordnungsstrategien in jüngsten orientierten Objektdetektoren führen die extremen geometrischen Formen und die begrenzten Merkmale orientierter winziger Objekte weiterhin zu schwerwiegenden Diskrepanz- und Ungleichgewichtsproblemen. Insbesondere sind Positionsvorwissen, Merkmale positiver Proben und Objektinstanzen nicht korrekt abgestimmt, und das Lernen extrem geformter Objekte ist aufgrund mangelnder geeigneter Merkmalsüberwachung verzerrt und unbalanciert. Um diese Probleme zu bewältigen, schlagen wir einen dynamischen Prior in Verbindung mit einem grob-zu-fein-Zuordnungsverfahren vor, das wir DCFL nennen. Einerseits modellieren wir Prior, Etikettenzuordnung und Objektrepräsentation alle dynamisch, um das Diskrepanzproblem zu verringern. Andererseits nutzen wir eine grobe Vorwissensübereinstimmung kombiniert mit feineren Nachwissensbedingungen, um die Etikettenzuordnung dynamisch vorzunehmen und so angemessene und relativ ausgewogene Überwachung für vielfältige Instanzen bereitzustellen. Umfangreiche Experimente auf sechs Datensätzen zeigen signifikante Verbesserungen gegenüber der Basislinie. Besonders hervorzuheben ist die Erreichung der Stand der Technik-Leistung für Einphasendetektoren auf den Datensätzen DOTA-v1.5, DOTA-v2.0 und DIOR-R unter Einphasen-Training und -Testung. Der Quellcode ist unter https://github.com/Chasel-Tsui/mmrotate-dcfl verfügbar.