il y a 9 jours

Agrégation auto-supervisée d'experts diversifiés pour la reconnaissance à queue longue indépendante des tests

Yifan Zhang, Bryan Hooi, Lanqing Hong, Jiashi Feng

Résumé

Les méthodes existantes de reconnaissance à queue longue, visant à entraîner des modèles équilibrés par classe à partir de données à distribution inégale, supposent généralement que les modèles seront évalués sur une distribution de classes de test uniforme. Toutefois, les distributions réelles de classes en test s'écartent souvent de cette hypothèse (par exemple, elles peuvent être à queue longue ou même inversement à queue longue), ce qui peut entraîner l'échec de ces méthodes dans des applications pratiques. Dans cet article, nous étudions une tâche plus réaliste mais également plus difficile, appelée reconnaissance à queue longue agnostique au test, dans laquelle la distribution de classes en entraînement est à queue longue, tandis que la distribution de classes en test est inconnue et non nécessairement uniforme. En plus du problème d'imbalance de classes, cette tâche pose un défi supplémentaire : le décalage de distribution entre les données d'entraînement et celles de test est inconnu. Pour relever ce défi, nous proposons une nouvelle approche, nommée Self-supervised Aggregation of Diverse Experts (SADE), fondée sur deux stratégies : (i) une nouvelle stratégie d'apprentissage d'experts aux compétences diversifiées, qui entraîne plusieurs experts à partir d'un seul jeu de données à queue longue stationnaire, chacun étant capable de gérer séparément différentes distributions de classes ; (ii) une nouvelle stratégie d'agrégation d'experts au moment du test, qui exploite la self-supervision pour combiner les experts appris afin de traiter des distributions de classes en test inconnues. Nous démontrons théoriquement que notre stratégie de self-supervision possède une capacité prouvée à simuler des distributions de classes agnostiques au test. Des résultats expérimentaux prometteurs montrent l'efficacité de notre méthode, tant sur la reconnaissance à queue longue classique que sur celle agnostique au test. Le code est disponible à l'adresse suivante : \url{https://github.com/Vanint/SADE-AgnosticLT}.