Command Palette
Search for a command to run...
Analyse de la structure rhétorique bilingue avec de grandes annotations parallèles
Analyse de la structure rhétorique bilingue avec de grandes annotations parallèles
Elena Chistova
Résumé
L'analyse du discours est une tâche cruciale en traitement automatique des langues naturelles visant à révéler les relations de niveau supérieur dans un texte. Malgré l'intérêt croissant pour l'analyse du discours interlinguistique, des défis persistent en raison de la limitation des données parallèles et des incohérences dans l'application de la Théorie de la Structure Rhétorique (RST) entre les langues et les corpus. Pour remédier à cela, nous présentons une annotation russe parallèle pour le grand et divers corpus GUM RST en anglais. En exploitant les avancées récentes, notre analyseur RST de bout en bout obtient des résultats d'état de l'art sur les corpus anglais et russe. Il démontre son efficacité tant dans les contextes monolingues que bilingues, réussissant même avec une annotation limitée en seconde langue. Selon nos connaissances, cette étude est la première à évaluer le potentiel de l'analyse du discours interlinguistique de bout en bout sur un corpus parallèle annoté manuellement.