HyperAIHyperAI
il y a 2 mois

Apprentissage à zéro par plongement de similarité sémantique

Ziming Zhang; Venkatesh Saligrama
Apprentissage à zéro par plongement de similarité sémantique
Résumé

Dans cet article, nous abordons une version du problème d'apprentissage par zéro où des données de source et de domaine cible pour les classes observées sont fournies. L'objectif lors des tests est de prédire avec précision l'étiquette de classe d'une instance du domaine cible non observée en se basant sur les informations latérales (par exemple, attributs) révélées pour les classes non observées. Notre méthode repose sur la considération de chaque donnée de source ou de cible comme un mélange de proportions de classes observées, et nous postulons que les motifs de mélange doivent être similaires si les deux instances appartiennent à la même classe non observée. Cette perspective nous conduit à apprendre des fonctions d'embedding source/cible qui transforment des données arbitraires du domaine source ou cible dans un même espace sémantique où la similarité peut être mesurée facilement. Nous développons un cadre max-margin pour apprendre ces fonctions de similarité et optimisons conjointement les paramètres par validation croisée. Nos résultats de test sont convaincants, conduisant à une amélioration significative en termes de précision sur la plupart des jeux de données de référence pour la reconnaissance par zéro-shot.