Uni-MIS : Compréhension unifiée de la langue parlée à plusieurs intentions par interaction multi-vue entre intentions et cases
À ce jour, la compréhension du langage parlé à plusieurs intentions (SLU) est devenue un sujet de recherche central dans le domaine du traitement du langage naturel (NLP), en raison de sa capacité à reconnaître et extraire plusieurs intentions exprimées dans une même énonciation, tout en annotant les étiquettes de slots correspondantes au niveau de la séquence. Les travaux antérieurs se sont principalement concentrés sur l’interaction entre intention et slot au niveau des tokens, afin de modéliser conjointement la détection d’intention et le remplissage de slots ; cependant, cette approche a conduit à une utilisation insuffisante des informations d’orientation intentionnelle anisotropes pendant l’entraînement conjoint. Dans ce travail, nous proposons une nouvelle architecture en modélisant la SLU multi-intentions comme une interaction multi-vue entre intention et slot. Cette architecture surmonte le goulot d’étranglement central de la SLU multi-intentions unifiée en capturant efficacement les relations intention-slot à travers des interactions aux niveaux de l’énoncé, du morceau (chunk) et du token. Nous développons par ailleurs un cadre neuronal, nommé Uni-MIS, dans lequel la SLU multi-intentions unifiée est modélisée comme une fusion d’interaction intention-slot à trois vues, permettant ainsi de mieux capter les informations d’interaction après une encodage spécifique. Un décodeur de détection d’intention au niveau du chunk est utilisé pour capturer de manière exhaustive les multiples intentions, tandis qu’un réseau graphique d’interaction intention-slot adaptatif est mis en œuvre pour saisir les informations d’intention à très fine échelle, afin de guider le remplissage final des slots. Nous menons des expériences approfondies sur deux jeux de données standards largement utilisés pour la SLU multi-intentions, où notre modèle surpasser tous les modèles de référence actuels, atteignant ainsi un nouveau record de performance pour la SLU multi-intentions unifiée. En outre, le benchmark ChatGPT que nous avons développé démontre qu’il existe un potentiel considérable de valeur de recherche dans le domaine de la SLU multi-intentions.