HyperAIHyperAI
vor 17 Tagen

ScaleDet: Ein skalierbarer Multi-Dataset-Objektdetektor

Yanbei Chen, Manchen Wang, Abhay Mittal, Zhenlin Xu, Paolo Favaro, Joseph Tighe, Davide Modolo
ScaleDet: Ein skalierbarer Multi-Dataset-Objektdetektor
Abstract

Die Verwendung mehrerer Datensätze zur Trainingsphase bietet eine praktikable Lösung zur Ausnutzung heterogener, großskaliger Datensätze ohne zusätzliche Annotationskosten. In dieser Arbeit stellen wir einen skalierbaren Mehr-Datensatz-Detektor (ScaleDet) vor, der seine Generalisierungsfähigkeit über Datensätze hinweg verbessert, wenn die Anzahl der trainierenden Datensätze erhöht wird. Im Gegensatz zu bestehenden Ansätzen für Mehr-Datensatz-Lernverfahren, die überwiegend auf manuelle Umbezeichnungen oder komplexe Optimierungen zur Vereinheitlichung der Labels über Datensätze hinweg angewiesen sind, führen wir eine einfache, aber skalierbare Formulierung ein, um einen einheitlichen semantischen Labelraum für die Mehr-Datensatz-Trainingsphase zu erzeugen. ScaleDet wird mittels visuell-textueller Ausrichtung trainiert, um die Labelzuweisung auf Basis der semantischen Ähnlichkeiten zwischen Labels über verschiedene Datensätze hinweg zu erlernen. Nach Abschluss des Trainings zeigt ScaleDet eine hervorragende Generalisierungsfähigkeit auf beliebigen vorgegebenen Upstream- und Downstream-Datensätzen, sowohl für bekannte als auch für unbekannte Klassen. Wir führen umfangreiche Experimente durch, wobei LVIS, COCO, Objects365 und OpenImages als Upstream-Datensätze sowie 13 Datensätze aus dem Bereich „Object Detection in the Wild (ODinW)“ als Downstream-Datensätze verwendet werden. Unsere Ergebnisse zeigen, dass ScaleDet herausragende Modellleistungen erzielt: ein mAP von 50,7 auf LVIS, 58,8 auf COCO, 46,8 auf Objects365, 76,2 auf OpenImages und 71,8 auf ODinW – wobei ScaleDet die Leistungszahlen aktueller State-of-the-Art-Detektoren mit demselben Backbone übertrifft.