HyperAIHyperAI
vor 17 Tagen

BigDetection: Ein großskaliger Benchmark für die Verbesserung der Vortrainierung von Objektdetektoren

Likun Cai, Zhi Zhang, Yi Zhu, Li Zhang, Mu Li, Xiangyang Xue
BigDetection: Ein großskaliger Benchmark für die Verbesserung der Vortrainierung von Objektdetektoren
Abstract

In den letzten Jahren wurden mehrere Datensätze und offene Herausforderungen für die Objekterkennung vorgestellt. Um allgemeinere und leistungsfähigere Systeme für die Objekterkennung zu entwickeln, führen wir in diesem Artikel einen neuen, großskaligen Benchmark namens BigDetection ein. Unser Ziel besteht darin, einfach die Trainingsdaten bestehender Datensätze (LVIS, OpenImages und Object365) unter Verwendung sorgfältig entworfener Prinzipien zu nutzen und einen umfangreicheren Datensatz für eine verbesserte Vortrainierung von Detektoren zu erstellen. Insbesondere leiten wir eine neue Taxonomie ab, die die heterogenen Labelräume verschiedener Quellen vereinheitlicht. Der BigDetection-Datensatz umfasst 600 Objektkategorien und enthält über 3,4 Millionen Trainingsbilder mit insgesamt 36 Millionen Bounding Boxes. Er ist in mehreren Dimensionen deutlich größer als frühere Benchmarks und bietet damit sowohl neue Möglichkeiten als auch herausfordernde Aufgaben. Ausführliche Experimente belegen die Gültigkeit von BigDetection als neuen Benchmark zur Bewertung verschiedener Methoden der Objekterkennung sowie seine Wirksamkeit als Vortrainingsdatensatz.