HyperAIHyperAI
il y a 11 jours

Un cadre interactif dynamique à graphe avec injection sémantique des étiquettes pour la compréhension du langage parlé

Zhihong Zhu, Weiyuan Xu, Xuxin Cheng, Tengtao Song, Yuexian Zou
Un cadre interactif dynamique à graphe avec injection sémantique des étiquettes pour la compréhension du langage parlé
Résumé

Les modèles conjoints de détection de multi-intentions et d’identification de slots gagnent en popularité, car ils se rapprochent davantage des scénarios réels complexes. Toutefois, les approches existantes présentent deux limites majeures : (1) elles se concentrent sur l’identification de corrélations implicites entre les énoncés et les étiquettes encodées en one-hot pour les deux tâches, tout en ignorant les caractéristiques explicites des étiquettes ; (2) elles intègrent directement les informations relatives aux multi-intentions pour chaque token, ce qui peut entraîner des prédictions erronées de slots en introduisant des intentions non pertinentes. Dans cet article, nous proposons un cadre intitulé DGIF, qui exploite d’abord l’information sémantique des étiquettes afin d’apporter au modèle des signaux supplémentaires et des connaissances a priori enrichies. Ensuite, un graphe interactif à plusieurs granularités est construit pour modéliser les corrélations entre intentions et slots. Plus précisément, nous introduisons une nouvelle approche pour construire ce graphe interactif à partir de l’injection de la sémantique des étiquettes, permettant une mise à jour automatique du graphe afin de mieux atténuer la propagation d’erreurs. Les résultats expérimentaux montrent que notre cadre surpasse significativement les approches existantes, obtenant une amélioration relative de 13,7 % par rapport au meilleur modèle précédent sur le jeu de données MixATIS en termes de précision globale.

Un cadre interactif dynamique à graphe avec injection sémantique des étiquettes pour la compréhension du langage parlé | Articles de recherche récents | HyperAI