HyperAIHyperAI
il y a 2 mois

Apprentissage en Zigzag pour la Détection d'Objets Faiblement Supervisée

Xiaopeng Zhang; Jiashi Feng; Hongkai Xiong; Qi Tian
Apprentissage en Zigzag pour la Détection d'Objets Faiblement Supervisée
Résumé

Ce travail traite de la détection d'objets faiblement supervisée avec uniquement une supervision au niveau des images lors de l'étape d'entraînement. Les approches précédentes entraînent les modèles de détection en utilisant l'intégralité des images en une seule fois, ce qui rend les modèles vulnérables à se retrouver piégés dans des sous-optimaux en raison des exemples faux positifs introduits. À la différence de ces méthodes, nous proposons une stratégie d'apprentissage en zigzag visant simultanément à découvrir des instances d'objets fiables et à prévenir le surapprentissage des échantillons initiaux. Pour atteindre cet objectif, nous développons d'abord un critère nommé Scores Moyens d'Accumulation d'Énergie (mEAS) pour mesurer automatiquement et classer la difficulté de localisation d'une image contenant l'objet cible, puis nous apprenons progressivement le détecteur en alimentant le modèle avec des exemples de difficulté croissante. De cette manière, le modèle peut être bien préparé par l'entraînement sur des exemples faciles avant d'apprendre à partir d'exemples plus difficiles, ce qui lui permet d'acquérir une capacité de détection plus forte et plus efficacement. De plus, nous introduisons une nouvelle stratégie de régularisation masquée sur les cartes de caractéristiques convolutionnelles de haut niveau pour éviter le surapprentissage des échantillons initiaux. Ces deux modules forment un processus d'apprentissage en zigzag, où l'apprentissage progressif vise à découvrir des instances d'objets fiables, tandis que la régularisation masquée augmente la difficulté de trouver correctement ces instances. Nous obtenons un mAP de 47,6% sur PASCAL VOC 2007, surpassant largement les meilleures performances actuelles.Note : - "Scores Moyens d'Accumulation d'Énergie" est traduit comme "mean Energy Accumulation Scores" (mEAS), car il s'agit probablement d'un terme technique spécifique.- "PASCAL VOC 2007" est conservé tel quel, car c'est un nom propre couramment utilisé dans le domaine.- "mAP" (mean Average Precision) est également conservé tel quel, car c'est un acronyme standard dans le domaine de la vision par ordinateur.