Transport optimal pour la reconnaissance à queue longue avec une matrice de coût apprentissable

Il attire l’attention sur le problème de reconnaissance à longue queue, une question urgente devenue très populaire récemment. À la différence de la reconnaissance conventionnelle, ce problème suppose que la répartition de l’ensemble d’entraînement est extrêmement déséquilibrée, tandis que les ensembles de validation et de test restent équilibrés. On peut prévoir que cela pose de sévères défis au comportement de généralisation du modèle, en raison du décalage de distribution entre les ensembles d’entraînement et de test. Les approches face à ce défi se divisent en deux catégories : d’une part, les méthodes conscientes de l’entraînement, visant à améliorer la généralisation du modèle en exploitant son potentiel pendant la phase d’entraînement ; d’autre part, les corrections post-hoc, souvent combinées de manière souple avec les méthodes conscientes de l’entraînement, qui visent à affiner les prédictions autant que possible en phase de post-traitement, offrant ainsi les avantages de simplicité et d’efficacité. Dans cet article, nous introduisons une direction alternative pour la correction post-hoc, qui dépasse les méthodes statistiques classiques. Mathématiquement, nous abordons ce problème du point de vue du transport optimal (OT), mais le choix de la matrice de coût exacte dans l’application du OT s’avère difficile et nécessite une connaissance experte des différentes tâches. Pour surmonter cette limitation, nous proposons d’utiliser une application linéaire afin d’apprendre de manière adaptative la matrice de coût, sans nécessiter de configuration manuelle. En testant notre méthode en pratique, nos expérimentations révèlent que, en plus d’une haute efficacité et d’une excellente performance, notre approche dépasse toutes les méthodes antérieures et atteint le meilleur résultat à ce jour.