2달 전

제2언어 학습자를 위한 텍스트 가독성 평가

Menglin Xia; Ekaterina Kochmar; Ted Briscoe
제2언어 학습자를 위한 텍스트 가독성 평가
초록

본 논문은 제2언어(L2) 학습자를 대상으로 하는 텍스트의 읽기 용이성 평가 작업을 다룹니다. 이 작업에서 주요 도전 과제 중 하나는 충분한 크기의 단계별 주석 데이터 부족입니다. 본 연구에서는 영어를 제2언어로 학습하는 학습자들을 위한 CEFR 등급 텍스트 데이터셋을 수집하고, 모국어 사용자와 제2언어 학습자 모두를 대상으로 한 텍스트 읽기 용이성 평가를 조사하였습니다. 우리는 일반화 방법을 적용하여 더 큰 모국어 말뭉치에서 훈련된 모델을 이용해 학습자의 텍스트 읽기 용이성을 추정하도록 적응시켰으며, 제한된 L2 데이터에서 시스템 성능을 개선하기 위해 모국어 데이터를 활용하는 영역 적응(domain adaptation) 및 자기학습(self-learning) 기술을 탐구하였습니다. 실험 결과, 학습자 텍스트에 대한 읽기 용이성 평가에서 가장 우수한 성능을 보인 모델은 정확도 0.797과 PCC 0.938를 달성하였습니다.

제2언어 학습자를 위한 텍스트 가독성 평가 | 최신 연구 논문 | HyperAI초신경