SCRDet: Auf dem Weg zu robusteren Detektionen für kleine, verstreute und gedrehte Objekte

Objekterkennung ist ein grundlegendes Element der Computer Vision. Trotz erheblicher Fortschritte bestehen weiterhin Herausforderungen bei der Erkennung von Objekten kleiner Größe, beliebiger Ausrichtung und dichter Verteilung. Neben natürlichen Bildern sind solche Probleme insbesondere für Luftbildaufnahmen von großer Bedeutung besonders ausgeprägt. In dieser Arbeit wird ein neuer Mehrkategorien-Rotationsdetektor für kleine, verstreute und gedrehte Objekte vorgestellt, nämlich SCRDet (Small, Cluttered and Rotated Objects Detector). Insbesondere wurde ein Sampling-Fusion-Netzwerk entwickelt, das mehrschichtige Merkmale mit effektiver Ankerabtastung fusioniert, um die Empfindlichkeit gegenüber kleinen Objekten zu verbessern. Gleichzeitig werden das überwachte Pixel-Aufmerksamkeitsnetzwerk und das Kanal-Aufmerksamkeitsnetzwerk gemeinsam untersucht, um die Erkennung kleiner und verstreuter Objekte durch Unterdrückung von Rauschen und Hervorhebung der Objektmerkmale zu optimieren. Für eine genauere Rotationsabschätzung wird der IoU-Konstantenfaktor (Intersection over Union) zum glatten L1-Verlust hinzugefügt, um das Randproblem des rotierenden Begrenzungsrahmens zu lösen. Umfangreiche Experimente auf zwei öffentlichen Fernerkundungsdatensätzen DOTA und NWPU VHR-10 sowie auf natürlichen Bild-Datensätzen COCO, VOC2007 und Szene-Textdaten ICDAR2015 zeigen die Spitzenleistung unseres Detektors. Der Code und die Modelle werden unter https://github.com/DetectionTeamUCAS zur Verfügung gestellt.