HyperAIHyperAI
vor 12 Tagen

Detektion kleiner Objekte bei Vögeln mit Swin Transformer

{Ichiro Ide, Takahiro Komamizu, Takatsugu Hirayama, Yasutomo Kawanishi, TingWei Liu, Marc A. Kastner, Da Huo}
Abstract

Objektdetektion ist die Aufgabe, Objekte innerhalb eines Bildes zu erkennen. Bei dieser Aufgabe stellt die Erkennung kleiner Objekte besondere Schwierigkeiten dar. Neben ihrer geringen Größe sind weitere Herausforderungen durch Verschmierung, Verdeckung und ähnliche Faktoren gegeben. Aktuelle Methoden zur Detektion kleiner Objekte sind auf Szenarien mit kleinen und dichten Objekten zugeschnitten, beispielsweise Fußgänger in Menschenmengen oder ferne Objekte in Fernerkundungsszenarien. Sobald jedoch das Zielobjekt klein und spärlich ist, fehlt es an ausreichend Trainingsbeispielen, was die Lernbarkeit effektiver Merkmale erschwert. In diesem Artikel präsentieren wir eine spezialisierte Methode zur Erkennung einer bestimmten Kategorie kleiner Objekte: Vögel. Insbesondere verbessern wir die Merkmale, die durch den „Neck“ – das Unter-Netzwerk zwischen dem Backbone und dem Vorhersagekopf – gelernt werden, durch eine hierarchische Architektur, um effektivere Merkmale zu extrahieren. Wir setzen Swin Transformer ein, um die Bilddatenmerkmale zu interpolieren, und passen die Größe der verschobenen Fenster an die Eigenschaften kleiner Objekte an. Experimente zeigen, dass die vorgeschlagene auf Swin Transformer basierende Neck-Architektur in Kombination mit CenterNet eine hervorragende Leistung erzielt, insbesondere wenn die Fenstergröße angepasst wird. Darüber hinaus stellen wir fest, dass kleinere Fenstergrößen (Standardwert 2) die mAP-Werte für die Detektion kleiner Objekte signifikant verbessern.

Detektion kleiner Objekte bei Vögeln mit Swin Transformer | Neueste Forschungsarbeiten | HyperAI