HyperAIHyperAI

Command Palette

Search for a command to run...

Amélioration du modèle de parsing RST neuronal grâce à des sous-arbres d'accord argent

Masaaki Nagata Manabu Okumura Hidetaka Kamigaito Tsutomu Hirao Naoki Kobayashi

Résumé

La plupart des méthodes précédentes de parsing selon la Théorie de la Structure Rhétorique (RST) s'appuient sur l'apprentissage supervisé, telles que les réseaux neuronaux, qui nécessitent un corpus annoté de taille et de qualité suffisantes. Toutefois, le RST Discourse Treebank (RST-DT), le corpus de référence pour le parsing RST en anglais, est de taille réduite en raison du coût élevé de l'annotation des arbres RST. Le manque de données d'entraînement annotées de grande taille entraîne des performances médiocres, en particulier pour la tâche d'attribution de relations. Ainsi, nous proposons une méthode visant à améliorer les modèles de parsing RST neuronaux en exploitant des données « silver », c’est-à-dire des données annotées automatiquement. Nous générons ainsi de grandes quantités de données silver à partir d’un corpus non annoté en utilisant un parseur RST de pointe. Pour garantir une qualité élevée des données silver, nous extrayons des sous-arbres d’accord à partir des arbres RST construits par les parseurs RST. Ensuite, nous pré-entraînons un parseur RST neuronal à l’aide de ces données silver, puis nous le fine-tunons sur le RST-DT. Les résultats expérimentaux montrent que notre méthode atteint les meilleurs scores micro-F1 pour la Nuclearité et la Relation, respectivement de 75,0 et 63,2. En outre, nous observons une amélioration notable du score Relation, avec une progression de 3,0 points par rapport au parseur de l’état de l’art précédent.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp