2달 전

단일 언어 말뭉치만을 사용한 비지도 기계 번역

Guillaume Lample; Alexis Conneau; Ludovic Denoyer; Marc'Aurelio Ranzato
단일 언어 말뭉치만을 사용한 비지도 기계 번역
초록

최근 기계 번역은 딥 러닝의 발전과 대규모 병렬 코퍼스의 확보 덕분에 뛰어난 성능을 달성하였습니다. 이러한 성공을 저자원 언어 쌍으로 확장하기 위한 시도가 많이 있었지만, 여전히 수만 개의 병렬 문장이 필요했습니다. 본 연구에서는 이러한 연구 방향을 극단적으로 발전시키고, 어떠한 병렬 데이터도 사용하지 않고 번역을 학습하는 것이 가능한지 조사하였습니다. 우리는 두 가지 다른 언어의 단일어 코퍼스에서 문장을 추출하여 동일한 잠재 공간으로 매핑하는 모델을 제안합니다. 이 공유된 특징 공간에서 두 언어 모두 재구성을 학습함으로써, 모델은 어떠한 라벨링된 데이터도 사용하지 않고 효과적으로 번역을 학습하게 됩니다. 우리는 널리 사용되는 두 개의 데이터셋과 두 개의 언어 쌍에 대해 모델을 시연하였으며, Multi30k와 WMT 영어-프랑스어 데이터셋에서 각각 32.8 및 15.1의 BLEU 점수를 보고하였습니다. 이는 훈련 과정에서 단 하나의 병렬 문장도 사용하지 않은 결과입니다.

단일 언어 말뭉치만을 사용한 비지도 기계 번역 | 최신 연구 논문 | HyperAI초신경