HyperAIHyperAI

Command Palette

Search for a command to run...

DMRST : Un Cadre Commun pour la Segmentation et l'Analyse Discursive de Type RST au Niveau du Document en Plusieurs Langues

Zhengyuan Liu†* Ke Shi† Nancy F. Chen†*

Résumé

L'analyse de la structure discursive du texte joue un rôle crucial dans la compréhension du flux d'information et de la structure argumentative en langage naturel, ce qui en fait une ressource précieuse pour les tâches ultérieures. Bien que les travaux précédents aient considérablement amélioré les performances de l'analyse discursive RST (Rhetorical Structure Theory), ils ne sont pas facilement applicables aux cas pratiques : (1) La segmentation des unités de discours élémentaires (EDU) n'est pas intégrée à la plupart des cadres existants pour le parsing arborescent, rendant ainsi difficile l'application de ces modèles à de nouvelles données. (2) La plupart des analyseurs ne peuvent être utilisés dans des scénarios multilingues, car ils ont été développés uniquement en anglais. (3) Les analyseurs formés sur des bases d'arbres mono-domaines ne généralisent pas bien sur des entrées hors domaine. Dans cette étude, nous proposons un cadre d'analyse discursive RST multilingue au niveau du document, qui effectue conjointement la segmentation EDU et le parsing arborescent discursif. De plus, nous présentons une stratégie d'augmentation par traduction croisée pour permettre au cadre de prendre en charge l'analyse multilingue et d'améliorer sa généralité inter-domaines. Les résultats expérimentaux montrent que notre modèle atteint des performances de pointe dans l'analyse discursive RST multilingue au niveau du document pour toutes les sous-tâches.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
DMRST : Un Cadre Commun pour la Segmentation et l'Analyse Discursive de Type RST au Niveau du Document en Plusieurs Langues | Articles | HyperAI