16일 전
통계적 기계 번역의 텍스트 단순화 최적화
{Chris Callison-Burch, Wei Xu, Quanze Chen, Ellie Pavlick, Courtney Napoles}

초록
최근의 문장 단순화 시스템은 주로 수작업으로 단순화된 병렬 문장 집합에서 어휘적·구문적 동의어 표현을 학습하기 위해 기초적인 기계 번역 모델을 사용한다. 그러나 이러한 방법은 수작업으로 구성된 단순화된 코퍼스의 품질과 양에 의해 한계를 지니며, 이러한 코퍼스를 구축하는 데 비용이 많이 든다. 본 논문에서는 이와 같은 제약을 극복하기 위해 통계적 기계 번역을 심층적으로 적응시켜 문장 단순화를 수행한다. 이 과정에서는 이중언어 텍스트로부터 학습된 대규모 동의어 표현과 다수의 참조를 가진 소규모 수작업 단순화 데이터를 활용한다. 본 연구는 문장 단순화 시스템의 튜닝과 평가에 효과적인 자동 평가 지표를 처음으로 설계한 것으로, 이 작업의 반복적 개발을 촉진할 것으로 기대된다.