Command Palette
Search for a command to run...
Intégration d'étiquettes pour la classification d'images
Intégration d'étiquettes pour la classification d'images
Akata Zeynep Perronnin Florent Harchaoui Zaid Schmid Cordelia
Résumé
Les attributs agissent comme des représentations intermédiaires permettant de partager les paramètres entre les classes, une nécessité lorsque les données d'entraînement sont limitées. Nous proposons de considérer la classification d'images basée sur les attributs comme un problème d'encodage des étiquettes : chaque classe est plongée dans l'espace des vecteurs d'attributs. Nous introduisons une fonction mesurant la compatibilité entre une image et un encodage d'étiquette. Les paramètres de cette fonction sont appris à partir d'un ensemble d'apprentissage comprenant des échantillons étiquetés, afin de garantir que, étant donné une image, les classes correctes obtiennent un score supérieur à celui des classes incorrectes. Les résultats obtenus sur les jeux de données Animals With Attributes et Caltech-UCSD-Birds montrent que le cadre proposé surpasser la méthode de référence classique, Direct Attribute Prediction, dans un scénario d'apprentissage zéro-shot. L'encodage des étiquettes possède une capacité intrinsèque à exploiter des sources d'information alternatives, voire complémentaires aux attributs, telles que les hiérarchies de classes ou les descriptions textuelles. En outre, l'encodage des étiquettes couvre l'ensemble du spectre des scénarios d'apprentissage, allant de l'apprentissage zéro-shot à l'apprentissage classique avec un grand nombre d'exemples étiquetés.