Amélioration de l'analyse syntaxique des dialogues à plusieurs intervenants grâce à l'intégration de domaines

Bien que les conversations à plusieurs intervenants soient souvent moins structurées que les monologues ou les documents, elles sont implicitement organisées par des corrélations sémantiques entre les échanges interactifs. L’analyse du discours dialogique peut alors être appliquée pour prédire la structure de dépendance et les relations entre les unités élémentaires du discours, fournissant ainsi des informations structurelles riches pour les tâches ultérieures. Toutefois, les corpus existants annotés au niveau du discours dialogique proviennent de domaines spécifiques et présentent des tailles d’échantillons limitées, ce qui entraîne une performance médiocre des approches data-driven sur de nouvelles conversations sans adaptation de domaine. Dans cet article, nous introduisons tout d’abord un parseur basé sur le Transformer et évaluons sa performance en contexte cross-domain. Nous adoptons ensuite trois méthodes, tirées à la fois de la perspective des données et de celle du modèle linguistique, afin d’obtenir une intégration de domaine et d’améliorer la capacité de généralisation. Les résultats expérimentaux montrent que le parseur neuronal bénéficie des méthodes proposées et obtient de meilleures performances sur des échantillons de dialogue cross-domain.