Command Palette
Search for a command to run...
Orientierte Objekte als Paare von Mittellinien
Orientierte Objekte als Paare von Mittellinien
Haoran Wei Yue Zhang Zhonghan Chang Hao Li Hongqi Wang Xian Sun
Zusammenfassung
Die Detektion ausgerichteter Objekte tritt häufig im Bereich der Erkennung von Texten in natürlichen Szenen sowie bei der Objektdetektion in Luftbildern auf. Traditionelle Detektoren für ausgerichtete Objekte basieren häufig auf rotierenden Anchors innerhalb der RCNN-Architekturen, wodurch die Anzahl der Anchors durch eine Vielzahl von Winkeln erheblich erhöht wird. In Verbindung mit einem rotierenden NMS-Algorithmus führt dies zu einer starken Zunahme der Rechenkomplexität dieser Modelle. In diesem Beitrag stellen wir ein neuartiges Modell namens Oriented Objects Detection Network (O²-DNet) vor, das ausgerichtete Objekte erkennt, indem es jeweils ein Paar Mittellinien innerhalb jedes Objekts vorhersagt. O²-DNet ist ein einstufiges, anchorfreies und NMS-freies Modell. Die Ziel-Liniensegmente unseres Ansatzes sind als zwei korrespondierende Mittellinien der ursprünglichen rotierenden Bounding-Box-Annotationen definiert, die direkt transformiert werden können, ohne dass zusätzliche manuelle Etikettierungen erforderlich sind. Experimente zeigen, dass O²-DNet hervorragende Ergebnisse auf den Datensätzen ICDAR 2015 und DOTA erzielt. Es ist bemerkenswert, dass Objekte im COCO-Datensatz als eine spezielle Form ausgerichteter Objekte mit einem Winkel von 90 Grad angesehen werden können. Auch auf diesen allgemeinen Datensätzen für die natürliche Objekterkennung erzielt O²-DNet konkurrenzfähige Ergebnisse.