
초록
자동 난이도 평가(Automatic Readability Assessment, ARA)는 텍스트에 적합한 독해 수준을 부여하는 작업으로, 전통적으로 자연어 처리(NLP) 연구에서 분류 문제로 다뤄져 왔다. 본 논문에서는 ARA에 대한 최초의 신경망 기반 쌍별 순위 매기기(pairwise ranking) 접근법을 제안하고, 기존의 분류, 회귀 및 비신경망 기반 순위 매기기 방법들과 이를 비교한다. 세 개의 영어 데이터셋과 하나의 프랑스어, 하나의 스페인어 데이터셋을 활용한 실험을 통해 제안 모델의 성능을 검증한다. 실험 결과, 제안된 접근법은 단일/크로스 코퍼스 테스트 환경에서 우수한 성능을 보이며, 영어 데이터로 훈련된 모델이 프랑스어 및 스페인어에 대해 제로샷(zero-shot) 크로스링구얼 순위 정확도 80% 이상을 달성함을 입증한다. 또한, 영어와 프랑스어의 병렬 이중언어 난이도 데이터셋을 공개한다. 본 논문은 ARA에 대한 최초의 신경망 기반 쌍별 순위 매기기 모델을 제안하며, 신경망 기반 모델을 활용한 크로스링구얼 제로샷 평가의 최초 결과를 제시한다.