HyperAIHyperAI
il y a 17 jours

Apprentissage de connexions intra-batch pour l'apprentissage profond de métriques

Jenny Seidenschwarz, Ismail Elezi, Laura Leal-Taixé
Apprentissage de connexions intra-batch pour l'apprentissage profond de métriques
Résumé

L’objectif de l’apprentissage de métriques est d’apprendre une fonction qui mappe les échantillons vers un espace de dimension inférieure, dans lequel les échantillons similaires sont plus proches les uns des autres que les échantillons dissimilaires. En particulier, l’apprentissage de métriques profondes utilise des réseaux neuronaux pour apprendre une telle fonction. La plupart des approches reposent sur des fonctions de perte qui ne prennent en compte que les relations entre des paires ou des triplets d’échantillons, qui appartiennent soit à la même classe, soit à deux classes différentes. Toutefois, ces méthodes ne explorent pas de manière complète l’espace d’embedding. À cet effet, nous proposons une approche fondée sur des réseaux de passage de messages, qui prend en compte toutes les relations présentes dans un mini-batch. Nous améliorons les vecteurs d’embedding en échangeant des messages entre tous les échantillons d’un même batch, permettant ainsi au processus d’entraînement de prendre conscience de la structure globale de l’ensemble. Étant donné que tous les échantillons n’ont pas la même importance pour prédire une frontière de décision, nous introduisons un mécanisme d’attention lors du passage de messages, afin de permettre à chaque échantillon de pondérer l’importance de ses voisins de manière adaptative. Nous obtenons des résultats de pointe sur les tâches de regroupement (clustering) et de recherche d’images sur les jeux de données CUB-200-2011, Cars196, Stanford Online Products et In-Shop Clothes. Pour faciliter les recherches futures, nous mettons à disposition le code source ainsi que les modèles via le lien suivant : https://github.com/dvl-tum/intra_batch_connections.