Tracer la même boîte englobante deux fois ? Gérer les annotations bruyantes dans la détection d'objets avec des étiquettes répétées

La fiabilité des systèmes d'apprentissage automatique supervisé dépend de l'exactitude et de la disponibilité des étiquettes de vérité terrain (ground truth). Toutefois, le processus d'annotation humaine, sujet aux erreurs, introduit le risque d'étiquettes bruitées, ce qui peut compromettre la faisabilité pratique de ces systèmes. Bien que l'entraînement avec des étiquettes bruitées soit une préoccupation majeure, la fiabilité des données de test est tout aussi cruciale pour évaluer la robustesse des résultats. Une approche courante pour atténuer ce problème consiste en une annotation répétée, où plusieurs annotateurs étiquettent le même exemple, et leurs étiquettes sont combinées afin d'obtenir une estimation améliorée de la vérité terrain. Dans cet article, nous proposons un nouvel algorithme de localisation qui adapte des méthodes éprouvées d'estimation de la vérité terrain aux tâches de détection d'objets et de segmentation d'instances. L'innovation principale de notre méthode réside dans sa capacité à transformer des problèmes combinés de localisation et de classification en problèmes de classification uniquement, permettant ainsi l'application de techniques telles que l'algorithme d'expectation-maximisation (EM) ou le vote majoritaire (MJV). Bien que notre focus principal soit l'agrégation de la vérité terrain unique pour les données de test, notre algorithme montre également des performances supérieures lors de l'entraînement sur le jeu de données TexBiG, dépassant à la fois l'entraînement avec étiquettes bruitées et l'agrégation de labels par fusion pondérée de boîtes (Weighted Boxes Fusion, WBF). Nos expériences indiquent que les bénéfices de l'annotation répétée ne se manifestent que sous des configurations spécifiques du jeu de données et d'annotation. Les facteurs clés semblent être (1) la complexité du jeu de données, (2) la cohérence des annotateurs, et (3) les contraintes budgétaires imposées à l'annotation.