11일 전

독해 가능성 평가를 위한 신경쌍순서 랭킹 모델

Justin Lee, Sowmya Vajjala
독해 가능성 평가를 위한 신경쌍순서 랭킹 모델
초록

자동 난이도 평가(Automatic Readability Assessment, ARA)는 텍스트에 적합한 독해 수준을 부여하는 작업으로, 전통적으로 자연어 처리(NLP) 연구에서 분류 문제로 다뤄져 왔다. 본 논문에서는 ARA에 대한 최초의 신경망 기반 쌍별 순위 매기기(pairwise ranking) 접근법을 제안하고, 기존의 분류, 회귀 및 비신경망 기반 순위 매기기 방법들과 이를 비교한다. 세 개의 영어 데이터셋과 하나의 프랑스어, 하나의 스페인어 데이터셋을 활용한 실험을 통해 제안 모델의 성능을 검증한다. 실험 결과, 제안된 접근법은 단일/크로스 코퍼스 테스트 환경에서 우수한 성능을 보이며, 영어 데이터로 훈련된 모델이 프랑스어 및 스페인어에 대해 제로샷(zero-shot) 크로스링구얼 순위 정확도 80% 이상을 달성함을 입증한다. 또한, 영어와 프랑스어의 병렬 이중언어 난이도 데이터셋을 공개한다. 본 논문은 ARA에 대한 최초의 신경망 기반 쌍별 순위 매기기 모델을 제안하며, 신경망 기반 모델을 활용한 크로스링구얼 제로샷 평가의 최초 결과를 제시한다.

독해 가능성 평가를 위한 신경쌍순서 랭킹 모델 | 최신 연구 논문 | HyperAI초신경