Command Palette
Search for a command to run...
Une approche embarrassantement simple pour l’apprentissage zéro-shot
Une approche embarrassantement simple pour l’apprentissage zéro-shot
Philip H. S. Torr Bernardino Romera-Paredes
Résumé
L’apprentissage zéro-shot consiste à apprendre à reconnaître de nouveaux concepts à partir uniquement de descriptions de ces concepts. De nombreuses approches sophistiquées ont été proposées pour relever les défis posés par ce problème. Dans cet article, nous décrivons une approche d’apprentissage zéro-shot pouvant être implémentée en une seule ligne de code, tout en étant capable de surpasser les méthodes de pointe sur des jeux de données standards. Cette approche repose sur un cadre plus général qui modélise les relations entre caractéristiques, attributs et classes à l’aide d’un réseau à deux couches linéaires, les poids de la couche supérieure étant fixés par l’environnement et non appris. Nous fournissons également une borne théorique sur l’erreur de généralisation de ce type d’approches, en les reformulant comme des méthodes d’adaptation de domaine. Des expériences menées sur trois jeux de données réels standards montrent que notre méthode surpasse significativement les approches de pointe sur l’ensemble des jeux, avec un taux d’amélioration atteignant jusqu’à 17 %.