Modèle à Entropie Minimale pour la Détection d'Objets Faiblement Supervisée

La détection d'objets faiblement supervisée est une tâche complexe lorsqu'elle est fournie avec une supervision par catégorie d'image mais qu'elle doit simultanément apprendre les emplacements des objets et les détecteurs d'objets. L'incohérence entre la supervision faible et les objectifs d'apprentissage introduit une grande variabilité dans les emplacements des objets et une ambiguïté significative pour les détecteurs. Dans cet article, un modèle latent à entropie minimale (MELM) est proposé pour la détection d'objets faiblement supervisée. L'entropie minimale sert de modèle pour apprendre les emplacements des objets et de métrique pour mesurer l'aléatoire de la localisation des objets pendant l'apprentissage. Elle vise principalement à réduire la variance des instances apprises et à atténuer l'ambiguïté des détecteurs. Le MELM est décomposé en trois composants : partition de clique de propositions, découverte de clique d'objets et localisation d'objets. Le MELM est optimisé à l'aide d'un algorithme d'apprentissage récurrent, qui utilise l'optimisation par continuation pour résoudre le problème difficile de non-convexité. Les expériences montrent que le MELM améliore considérablement les performances de la détection d'objets faiblement supervisée, de la localisation d'objets faiblement supervisée et de la classification d'images, en comparaison avec les approches les plus avancées actuellement disponibles.