11일 전
아랍어 텍스트의 자동 디아크리티제이션을 위한 효과적인 딥러닝 모델
{Ali Mustafa Qamar, Mokthar Ali Hasan Madhfar}
초록
아랍어를 위한 텍스트-to-음성 합성 시스템을 구축하는 과정에서, 시스템이 많은 발음 오류를 포함한 음성 출력을 생성하는 것을 발견했다. 이러한 오류의 주요 원인은 현대 표준 아랍어 문장에서 다이아크리틱(음성 및 문법 정보를 제공하는 글자 위나 아래에 표시되는 작은 기호)이 누락되어 있다는 점이다. 본 연구에서는 딥러닝 기반의 텍스트-to-음성 합성 시스템 개발 과정에서 도출한 결과를 바탕으로 아랍어 텍스트의 다이아크리틱을 복원하기 위한 세 가지 딥러닝 모델을 제안한다. 첫 번째 모델은 간단한 딥러닝 모델이 데이터 코퍼스에서 어떻게 성능을 발휘하는지를 평가하기 위한 베이스라인 모델이다. 두 번째 모델은 인코더-디코더 아키텍처를 기반으로 하며, 본 연구의 텍스트-to-음성 합성 모델과 유사하지만, 본 문제에 적합하도록 다수의 수정이 가해졌다. 세 번째 모델은 텍스트-to-음성 모델의 인코더 부분을 활용한 것으로, 단어 오류율(word error rate)과 다이아크리틱 오류율(diacritic error rate) 모두에서 최신 기술 수준(state-of-the-art)의 성능을 달성했다. 이러한 모델들은 텍스트-to-음성 합성, 품사 태깅, 기계 번역 등 다양한 자연어 처리 응용 분야에 기여할 수 있다.