Entraînement par précision moyenne hiérarchique pour la récupération d’images pertinentes

La recherche d’images est généralement évaluée à l’aide de métriques telles que la précision moyenne (AP) ou le rappel à k (Recall@k). Toutefois, ces métriques sont limitées aux étiquettes binaires et ne tiennent pas compte de la gravité des erreurs. Ce papier introduit une nouvelle méthode d’apprentissage hiérarchique de l’AP pour la recherche d’images pertinentes (HAP-PIER). HAPPIER repose sur une nouvelle métrique, l’H-AP, qui exploite une hiérarchie de concepts afin de raffiner l’AP en intégrant l’importance des erreurs et en améliorant l’évaluation des classements. Pour entraîner des modèles profonds avec l’H-AP, nous analysons soigneusement la structure du problème et proposons un surrogate borné inférieur lisse combiné à une perte de regroupement (clustering loss) garantissant un ordre cohérent. Des expériences étendues sur 6 jeux de données montrent que HAPPIER surpasse significativement les méthodes de pointe pour la recherche hiérarchique, tout en étant compétitif avec les approches les plus récentes lorsqu’il s’agit d’évaluer les performances de classement à très fine échelle. Enfin, nous démontrons que HAPPIER favorise une meilleure organisation de l’espace d’embedding et évite la majorité des cas de défaillance graves caractéristiques des méthodes non hiérarchiques. Notre code est disponible publiquement à l’adresse suivante : https://github.com/elias-ramzi/HAPPIER.