17일 전
펜엘로피에: 기계 번역을 통한 그리스어를 위한 오픈 정보 추출 지원
Dimitris Papadopoulos, Nikolaos Papadakis, Nikolaos Matsatsinis

초록
이 논문에서는 EACL 2021 SRW에 제출한 우리의 기여를 제시한다. 본 연구는 개방형 정보 추출(Open Information Extraction, OIE) 환경에서 고자원 언어와 저자원 언어 간의 격차를 해소하는 데 목적이 있으며, 이를 그리스어를 대상으로 실증한다. 본 논문의 목적은 두 가지이다. 첫째, 트랜스포머(Transformer) 아키텍처를 기반으로 영어-그리스어 및 그리스어-영어 간의 신경망 기반 기계 번역(Neural Machine Translation, NMT) 모델을 구축한다. 둘째, 이러한 NMT 모델을 활용하여 그리스어 텍스트를 영어로 번역한 후, 자연어 처리(NLP) 파이프라인에 입력으로 사용한다. 이 과정에서 전처리 및 삼중항 추출(triple extraction) 작업을 수행한다. 마지막으로, 추출된 삼중항을 다시 그리스어로 역번역(back-translation)한다. 본 연구는 기준 데이터셋을 대상으로 NMT 및 OIE 방법에 대한 평가를 수행하였으며, 그리스어 자연어 처리 분야에서 기존 최고 성능(SOTA)을 초월하는 결과를 보여준다.