HyperAIHyperAI
il y a 10 jours

Une simple enquête linéaire épisodique améliore la reconnaissance visuelle dans le monde réel

{Yi Yang, Xiaohan Wang, Linchao Zhu, Yuanzhi Liang}
Une simple enquête linéaire épisodique améliore la reconnaissance visuelle dans le monde réel
Résumé

Comprendre la généralisation des réseaux et la discrimination des caractéristiques constitue un problème de recherche ouvert en reconnaissance visuelle. De nombreuses études ont été menées afin d’évaluer la qualité des représentations caractéristiques. Une des stratégies simples consiste à utiliser un classificateur de sondage linéaire (linear probing) pour évaluer quantitativement la précision de classification sur les caractéristiques obtenues. Le classificateur linéaire classique est généralement utilisé uniquement comme proxy au moment de l’inférence, mais son efficacité dans la mesure de la pertinence des caractéristiques pour une classification linéaire reste largement ignorée durant l’entraînement. Dans cet article, nous proposons un classificateur de sondage linéaire épisodique (episodic linear probing, ELP), conçu pour refléter de manière en ligne la généralisation des représentations visuelles. L’ELP est entraîné à partir de caractéristiques détachées du réseau et réinitialisé de manière épisodique. Il permet ainsi de mesurer la discriminabilité des représentations visuelles pendant l’entraînement. Ensuite, nous introduisons un terme de régularisation adapté à l’ELP (ELP-SR), qui reflète les distances entre les distributions de probabilité du classificateur ELP et du classificateur principal. L’ELP-SR utilise un facteur de re-échelonnement pour régulariser chaque échantillon durant l’entraînement, modulant de manière adaptative la fonction de perte et encourageant les caractéristiques à être à la fois discriminantes et généralisables. Nous observons des améliorations significatives sur trois tâches réelles de reconnaissance visuelle, notamment la classification visuelle fine-grain, la reconnaissance visuelle à longue queue (long-tailed) et la reconnaissance d’objets génériques. Les gains de performance démontrent l’efficacité de notre méthode dans l’amélioration de la généralisation du réseau et de la discrimination des caractéristiques.

Une simple enquête linéaire épisodique améliore la reconnaissance visuelle dans le monde réel | Articles de recherche récents | HyperAI