PENELOPIE : Permettre l’extraction ouverte d’information pour la langue grecque grâce à la traduction automatique

Dans cet article, nous présentons notre soumission pour le SRW de l’EACL 2021, une méthodologie visant à réduire l’écart entre les langues à fort et celles à faible ressources dans le cadre de l’extraction ouverte d’informations (OIE), illustrée ici sur la langue grecque. Les objectifs de ce travail sont doubles : premièrement, nous développons des modèles de traduction automatique neuronale (NMT) en direction anglo-grecque et grecco-anglaise, fondés sur l’architecture Transformer. Deuxièmement, nous exploitons ces modèles NMT pour produire des traductions en anglais de textes grecs, utilisés comme entrée dans notre pipeline NLP, auquel nous appliquons une série de traitements préalables ainsi que des tâches d’extraction de triples. Enfin, nous effectuons une rétraduction des triples extraits en grec. Nous menons une évaluation de nos méthodes NMT et OIE sur des jeux de données de référence, et démontrons que notre approche dépasse l’état de l’art actuel pour le traitement de la langue grecque.