PENELOPIE: Ermöglicht die offene Informationsextraktion für die griechische Sprache durch maschinelles Übersetzen

In diesem Paper präsentieren wir unsere Einreichung für die EACL 2021 SRW; eine Methodik, die darauf abzielt, die Lücke zwischen hoch- und niedrigresourcigen Sprachen im Kontext des Open Information Extraction (OIE) zu schließen, und demonstrieren sie am Beispiel der griechischen Sprache. Die Ziele dieses Beitrags sind zweifach: Erstens entwickeln wir neuronale Maschinenübersetzungsmodelle (NMT) für die Übersetzungen Englisch–Griechisch und Griechisch–Englisch basierend auf der Transformer-Architektur. Zweitens nutzen wir diese NMT-Modelle, um griechische Texte in Englisch zu übersetzen, die als Eingabe für unsere NLP-Pipeline dienen, auf die anschließend eine Reihe von Vorverarbeitungsschritten und Triple-Extraktionen angewendet werden. Abschließend führen wir eine Rückübersetzung der extrahierten Tripel in Griechisch durch. Wir evaluieren sowohl unsere NMT- als auch unsere OIE-Methoden an Benchmark-Datensätzen und zeigen, dass unser Ansatz die derzeitige State-of-the-Art für die griechische Sprache übertrifft.