11일 전

독해 가능성 평가를 위한 언어적 특성

Tovly Deutsch, Masoud Jasbi, Stuart Shieber
독해 가능성 평가를 위한 언어적 특성
초록

가독성 평가의 목적은 독자가 학습하는 데 적합한 수준으로 텍스트를 자동으로 분류하는 데 있다. 기존의 접근 방식은 다양한 언어학적으로 유의미한 특징을 사용하며, 단순한 기계학습 모델과 결합하였다. 최근에는 이러한 특징을 제거하고 딥러닝 모델을 활용함으로써 성능을 향상시킨 방법들이 등장하였다. 그러나 딥러닝 모델에 언어학적으로 유의미한 특징을 추가하는 것이 성능 향상에 더 기여할 수 있는지 여부는 아직 알려져 있지 않다. 본 논문은 이러한 두 가지 접근 방식을 결합하여 전반적인 모델 성능을 향상시키고, 이 질문에 답하고자 한다. 두 개의 대규모 가독성 데이터셋을 대상으로 평가한 결과, 충분한 학습 데이터가 제공되는 조건 하에서는 딥러닝 모델에 언어학적으로 유의미한 특징을 추가하더라도 최첨단 성능을 추가로 향상시키지 못하는 것으로 나타났다. 본 연구 결과는 최첨단 딥러닝 모델이 가독성과 관련된 텍스트의 언어학적 특징을 효과적으로 대표하고 있다는 가설에 대한 초보적인 증거를 제공한다. 향후 이러한 모델 내부에서 형성되는 표현의 본질에 관한 연구는 학습된 특징들과 기존 접근 방식에서 제안된 언어학적 특징 간의 관계를 더 명확히 밝혀줄 수 있을 것이다.

독해 가능성 평가를 위한 언어적 특성 | 최신 연구 논문 | HyperAI초신경