Graph-RISE : Embedding Sémantique d'Images Régularisé par Graphe

L'apprentissage de représentations d'images pour capturer des sémantiques à grain fin est une tâche complexe et importante qui permet de nombreuses applications telles que la recherche d'images et le regroupement. Dans cet article, nous présentons Graph-Regularized Image Semantic Embedding (Graph-RISE), un cadre d'apprentissage neuronal à grande échelle qui nous permet de former des plongements capables de discriminer des étiquettes sémantiques ultra-fines sans précédent, de l'ordre de O(40M). Graph-RISE surpasse les algorithmes d'embedding d'images les plus avancés actuellement disponibles sur plusieurs tâches d'évaluation, notamment la classification d'images et le classement par triplets. Nous fournissons des études de cas pour démontrer que, qualitativement, la recherche d'images basée sur Graph-RISE capture efficacement la sémantique et, comparée à l'état de l'art, distingue des nuances à des niveaux plus proches de la perception humaine.