HyperAIHyperAI
il y a 2 mois

Projection d'entités via la traduction automatique pour le NER interlingue

Alankar Jain; Bhargavi Paranjape; Zachary C. Lipton
Projection d'entités via la traduction automatique pour le NER interlingue
Résumé

Bien que plus de 100 langues soient prises en charge par des systèmes de traduction automatique robustes et prêts à l'emploi, seules une partie d'entre elles disposent de grands corpus annotés pour la reconnaissance d'entités nommées. Motivés par ce constat, nous exploitons la traduction automatique pour améliorer les approches de projection d'annotation dans le cadre de la reconnaissance d'entités nommées interlinguistique. Nous proposons un système qui surpasse les méthodes précédentes de projection d'entités en : (a) utilisant deux fois les systèmes de traduction automatique : d'abord pour traduire les phrases, puis pour traduire les entités ; (b) appariant les entités sur la base de leur similarité orthographique et phonétique ; et (c) identifiant les correspondances en fonction des statistiques distributionnelles dérivées du jeu de données. Notre approche améliore les méthodes actuelles de pointe pour la reconnaissance d'entités nommées interlinguistique sur 5 langues diverses, avec une moyenne de 4,1 points. De plus, notre méthode atteint des scores F_1 de pointe pour l'arménien, surpassant même un modèle monolingue formé sur des données sources arméniennes.

Projection d'entités via la traduction automatique pour le NER interlingue | Articles de recherche récents | HyperAI