BigDetection : Un benchmark à grande échelle pour le pré-entraînement amélioré des détecteurs d'objets

De récents travaux ont introduit plusieurs jeux de données et défis ouverts pour la détection d'objets. Afin de concevoir des systèmes de détection d'objets plus généraux et plus puissants, nous proposons dans cet article un nouveau benchmark à grande échelle, nommé BigDetection. Notre objectif est d'utiliser simplement les données d'entraînement provenant de jeux de données existants (LVIS, OpenImages et Object365), selon des principes soigneusement conçus, afin de constituer un ensemble de données plus vaste pour une pré-formation améliorée des détecteurs. Plus précisément, nous avons établi une nouvelle taxonomie qui unifie les espaces d'étiquetage hétérogènes provenant de différentes sources. Le jeu de données BigDetection comprend 600 catégories d'objets et contient plus de 3,4 millions d'images d'entraînement, munies de 36 millions de boîtes englobantes. Il est significativement plus volumineux que les benchmarks antérieurs selon plusieurs dimensions, offrant à la fois de nouvelles opportunités et de nouveaux défis. Des expériences étendues démontrent sa validité en tant que nouveau benchmark pour évaluer diverses méthodes de détection d'objets, ainsi que son efficacité en tant que jeu de données de pré-formation.