SANDWiCH : Analyse sémantique des voisins pour le débattement des mots dans le contexte ad hoc

L’essor des modèles linguistiques à grande échelle (LLM) conversationnels génératifs au cours des deux dernières années a déclenché une course au développement de systèmes promettant des expériences conversationnelles et de raisonnement proches de celles humaines. Toutefois, des études récentes indiquent que la compréhension du langage offerte par ces modèles reste limitée et éloignée des performances humaines, en particulier dans la saisie du sens contextuel des mots, un aspect fondamental du raisonnement. Dans cet article, nous présentons un cadre simple mais efficace sur le plan computationnel pour la désambiguïsation des sens des mots (WSD) multilingue. Notre approche reformule la tâche de WSD comme une analyse de discrimination de clusters au sein d’un réseau sémantique affiné à partir de BabelNet à l’aide de l’algèbre de groupe. Nous validons notre méthode sur plusieurs benchmarks de WSD, atteignant un nouveau record d’état de l’art pour toutes les langues et toutes les tâches, ainsi que dans les évaluations individuelles par catégorie grammaticale. Notamment, notre modèle dépasse significativement les performances des alternatives actuelles, même dans les langues à faibles ressources, tout en réduisant le nombre de paramètres de 72 %.