17日前
PENELOPIE:機械翻訳を活用したギリシャ語向けオープン情報抽出の実現
Dimitris Papadopoulos, Nikolaos Papadakis, Nikolaos Matsatsinis

要約
本稿では、EACL 2021 SRW(Shared Task on Open Information Extraction)への提出物として、オープン情報抽出(Open Information Extraction: OIE)の文脈において高資源言語と低資源言語の間のギャップを埋めるための手法を提示する。本研究ではギリシャ語を対象として、その有効性を示す。本研究の目的は二つである。第一に、Transformerアーキテクチャに基づいた英語→ギリシャ語およびギリシャ語→英語のニューラル機械翻訳(Neural Machine Translation: NMT)モデルを構築する。第二に、これらのNMTモデルを活用して、ギリシャ語テキストを英語に翻訳し、これを自然言語処理(NLP)パイプラインの入力として用いる。その後、前処理および三項抽出(triple extraction)の複数のタスクを適用する。最終的に、抽出された三項を英語からギリシャ語にバック翻訳する。本研究では、ベンチマークデータセットを用いてNMTおよびOIE手法の両方を評価し、ギリシャ語自然言語処理において、既存の最先端手法を上回る性能を示した。