HyperAIHyperAI
vor 19 Tagen

VarifocalNet: Ein IoU-orientierter dichter Objektdetektor

Haoyang Zhang, Ying Wang, Feras Dayoub, Niko Sünderhauf
VarifocalNet: Ein IoU-orientierter dichter Objektdetektor
Abstract

Die präzise Rangfolge der großen Anzahl an Kandidatdetektionen ist entscheidend dafür, dass dichte Objektdetektoren eine hohe Leistung erzielen. Vorherige Arbeiten nutzen die Klassifikationsbewertung oder eine Kombination aus Klassifikations- und vorhergesagter Lokalisierungsbewertung zur Rangordnung der Kandidaten. Beide Ansätze führen jedoch nicht zu einer zuverlässigen Rangfolge, was die Detektionsleistung beeinträchtigt. In diesem Paper schlagen wir vor, eine iou-orientierte Klassifikationsbewertung (Iou-aware Classification Score, IACS) als gemeinsame Darstellung der Objektpräsenzunsicherheit und der Lokalisierungsgenauigkeit zu lernen. Wir zeigen, dass dichte Objektdetektoren mithilfe der IACS eine genauere Rangfolge der Kandidatdetektionen erreichen können. Dazu entwickeln wir eine neue Verlustfunktion, die wir Varifocal Loss nennen, um einen dichten Objektdetektor zu trainieren, um die IACS vorherzusagen. Zudem schlagen wir eine neue sternförmige Darstellung der Bounding Box-Features für die IACS-Vorhersage und die Verbesserung der Bounding Box vor. Durch die Kombination dieser beiden neuen Komponenten mit einem zusätzlichen Verfeinerungsast für die Bounding Box bauen wir einen iou-orientierten dichten Objektdetektor auf Basis der FCOS+ATSS-Architektur, den wir VarifocalNet oder kurz VFNet nennen. Umfangreiche Experimente auf MS COCO zeigen, dass unser VFNet den starken Baseline mit unterschiedlichen Backbone-Architekturen konsistent um ca. 2,0 AP übertrifft. Unser bestes Modell, VFNet-X-1200 mit Res2Net-101-DCN, erreicht auf dem COCO test-dev eine Einzelmodell-Einzelmaßstab-AP von 55,1, was den derzeitigen Stand der Technik unter den verschiedenen Objektdetektoren darstellt. Der Quellcode ist unter https://github.com/hyz-xmaster/VarifocalNet verfügbar.