12일 전

체코어를 위한 신경망 생성: 데이터 및 기준 모델

{Filip Jur{\v{c}}{\'\i}{\v{c}}ek, Ond{\v{r}}ej Du{\v{s}}ek}
체코어를 위한 신경망 생성: 데이터 및 기준 모델
초록

우리는 레스토랑 도메인에서 체코어에 대한 엔드투엔드 자연어 생성(NLG)을 위한 최초의 데이터셋을 제안하며, 시퀀스-투-시퀀스 접근법을 사용한 여러 강력한 베이스라인 모델을 함께 제시한다. 일반적으로 비영어권 NLG 연구는 여전히 미비한 상태이지만, 체코어는 형태론적으로 풍부한 언어이기 때문에 이 작업은 더욱 복잡하다. 체코어는 명사형 엔티티에 대해 형태 변화(형태적 변형)가 필요하기 때문에, 일반적인 비어려스화(delexicalization)나 복사(copy) 메커니즘은 즉시 적용이 불가능하며, 생성된 출력을 적절히 어형화하는 것도 간단하지 않다. 실험을 통해 본 연구에서는 이 문제를 해결하기 위한 두 가지 다른 접근법을 제시한다: (1) 어형화 과정에서 신경망 언어 모델을 활용하여 적절한 형태 변화된 형태를 선택하는 방식, (2) 두 단계 생성 구조: 시퀀스-투-시퀀스 모델이 어근(lemma)과 형태적 태그를 교차 배치된 시퀀스로 생성한 후, 이를 형태학적 생성기(morphological generator)를 통해 형태 변화시키는 방식.

체코어를 위한 신경망 생성: 데이터 및 기준 모델 | 최신 연구 논문 | HyperAI초신경