HyperAIHyperAI
il y a 11 jours

Un modèle conjoint pour la récupération des pronoms omis et l’analyse de la discourse conversationnelle dans les échanges oraux chinois

Jingxuan Yang, Kerui Xu, Jun Xu, Si Li, Sheng Gao, Jun Guo, Nianwen Xue, Ji-Rong Wen
Un modèle conjoint pour la récupération des pronoms omis et l’analyse de la discourse conversationnelle dans les échanges oraux chinois
Résumé

Dans cet article, nous présentons un modèle neuronal pour la récupération conjointe des pronoms omis (DPR, Dropped Pronoun Recovery) et l’analyse de discours conversationnel (CDP, Conversational Discourse Parsing) dans les échanges oraux chinois. Nous montrons que les tâches de DPR et de CDP sont étroitement liées, et qu’un modèle conjoint permet d’améliorer les deux. Nous désignons notre modèle par DiscProReco. Celui-ci encode d’abord les tokens de chaque énoncé dans une conversation à l’aide d’un Réseau de Convolution Graphique orienté (GCN). Les états des tokens d’un énoncé sont ensuite agrégés afin d’obtenir un état unique par énoncé. Ces états d’énoncé sont ensuite introduits dans un classificateur biaffine afin de construire un graphe de discours conversationnel. Un second GCN (multi-relational) est ensuite appliqué aux états d’énoncé pour produire une représentation enrichie des relations discursives, qui est ensuite fusionnée avec les états des tokens de chaque énoncé pour alimenter une couche de récupération des pronoms omis. Le modèle conjoint est entraîné et évalué sur un nouveau jeu de données, appelé SPDPR (Structure Parsing-enhanced Dropped Pronoun Recovery), que nous avons annoté avec deux types d’informations. Les résultats expérimentaux obtenus sur le jeu SPDPR ainsi que sur d’autres benchmarks montrent que DiscProReco surpasse significativement les meilleures approches actuelles pour les deux tâches.

Un modèle conjoint pour la récupération des pronoms omis et l’analyse de la discourse conversationnelle dans les échanges oraux chinois | Articles de recherche récents | HyperAI