il y a 19 jours
Un détecteur d'objets puissant et reproductible utilisant uniquement des jeux de données publics
Tianhe Ren, Jianwei Yang, Shilong Liu, Ailing Zeng, Feng Li, Hao Zhang, Hongyang Li, Zhaoyang Zeng, Lei Zhang

Résumé
Ce travail présente Focal-Stable-DINO, un modèle robuste et reproductible pour la détection d'objets, atteignant 64,6 AP sur COCO val2017 et 64,8 AP sur COCO test-dev, en utilisant uniquement 700 millions de paramètres et sans aucune augmentation au moment du test. Ce modèle exploite la combinaison d'un squelette FocalNet-Huge puissant et d'un détecteur Stable-DINO efficace. Contrairement aux modèles de pointe existants qui reposent sur un nombre important de paramètres, des techniques d'entraînement complexes et des données privées à grande échelle ou fusionnées, notre modèle est entièrement entraîné sur le jeu de données publique Objects365, ce qui garantit la reproductibilité de notre approche.