
초록
아르바 시쿠라(Arba Sicula)는 시칠리아어-영어 번역 문장 17,000개 쌍을 이용하여 시칠리아어의 첫 번째 신경 기계 번역기를 개발하였습니다. 작은 하위 단어 사전을 사용하여, 우리는 높은 드롭아웃(dropout) 매개변수를 가진 작은 트랜스포머(Transformer) 모델들을 훈련시키고 BLEU 점수가 20점대 후반을 달성하였습니다. 이후에 데이터셋을 역번역(backtranslation)과 다국어 번역(multilingual translation)으로 보완하여 점수를 30점대 중반으로 끌어올렸습니다. 또한 우리의 성공은 데이터셋에 이론적 정보를 통합한 것에도 기인합니다. 훈련 전에, 우리는 교재에서 발견할 수 있는 종결사를 하위 단어 사전에 편향시켰으며, 데이터셋에는 교재 연습문제도 포함시켰습니다.