Les points d'ancrage sont-ils vraiment indispensables dans l'apprentissage avec bruit de label ?

Dans l'apprentissage avec bruit d'étiquetage, la \textit{matrice de transition de bruit}, qui représente les probabilités que des étiquettes propres se transforment en étiquettes bruyantes, joue un rôle central dans la construction de \textit{classifieurs statistiquement cohérents}. Les théories existantes ont montré que la matrice de transition peut être apprise en exploitant des \textit{points d'ancrage} (c'est-à-dire, des points de données qui appartiennent presque certainement à une classe spécifique). Cependant, en l'absence de points d'ancrage, la matrice de transition sera mal apprise et ces classifieurs cohérents actuels dégraderont considérablement. Dans cet article, sans utiliser de points d'ancrage, nous proposons une méthode de \textit{révision de transition} ($T$-Révision) pour apprendre efficacement les matrices de transition, conduisant ainsi à des classifieurs améliorés. Plus précisément, pour apprendre une matrice de transition, nous l'initialisons tout d'abord en utilisant des points de données similaires aux points d'ancrage, ayant des probabilités postérieures élevées pour les classes bruyantes. Ensuite, nous modifions cette matrice initialisée en ajoutant une \textit{variable d'écart}, qui peut être apprise et validée simultanément avec le classifieur en utilisant des données bruyantes. Les résultats empiriques sur des jeux de données simulés et réels avec bruit d'étiquetage montrent que sans utiliser des points d'ancrage exacts, la méthode proposée est supérieure aux méthodes actuelles les plus avancées dans l'apprentissage avec bruit d'étiquetage.