HyperAIHyperAI
il y a 8 jours

Apprentissage des étiquettes imprécises : un cadre unifié pour l'apprentissage avec diverses configurations d'étiquettes imprécises

Hao Chen, Ankit Shah, Jindong Wang, Ran Tao, Yidong Wang, Xing Xie, Masashi Sugiyama, Rita Singh, Bhiksha Raj
Apprentissage des étiquettes imprécises : un cadre unifié pour l'apprentissage avec diverses configurations d'étiquettes imprécises
Résumé

L’apprentissage avec des critères de label réduits, tels que les labels bruyants, les labels partiels ou les candidats multiples de label, que nous désignons de manière générique comme des labels imprécis, constitue un défi courant dans les tâches d’apprentissage automatique. Les méthodes antérieures ont tendance à proposer des architectures spécifiques pour chaque configuration émergente de labels imprécis, ce qui s’avère généralement insoutenable lorsque plusieurs configurations d’imprécision coexistent simultanément. Dans cet article, nous introduisons l’apprentissage avec des labels imprécis (ILL, Imprecise Label Learning), un cadre unifié permettant de traiter diverses configurations de labels imprécis. L’ILL exploite l’algorithme d’expectation-maximisation (EM) pour modéliser l’information issue des labels imprécis, en considérant les labels précis comme des variables latentes. Contrairement aux approches précédentes qui cherchent à approximer les labels corrects durant l’entraînement, l’ILL prend en compte toute la distribution des étiquettes possibles induite par l’information imprécise. Nous démontrons que l’ILL s’adapte de manière transparente à l’apprentissage avec labels partiels, à l’apprentissage semi-supervisé, à l’apprentissage avec labels bruyants, et plus important encore, à un mélange de ces cadres. Notamment, l’ILL dépasse les techniques spécifiques existantes pour la gestion des labels imprécis, marquant ainsi la première approche unifiée offrant des performances robustes et efficaces dans diverses configurations exigeantes. Nous espérons que ce travail inspirera des recherches ultérieures sur ce sujet, libérant ainsi tout le potentiel de l’ILL dans des scénarios plus larges où les labels précis sont coûteux et complexes à obtenir.