15일 전

교육 문헌을 구분짓는 요소는 무엇인가? 트랜스포머와 계산 언어학의 다중모달 융합 접근법

Jordan J. Bird
교육 문헌을 구분짓는 요소는 무엇인가? 트랜스포머와 계산 언어학의 다중모달 융합 접근법
초록

영어 교육 과정에 새로운 문학 자료를 통합하는 것은 교사들이 읽기 가능성을 신속하게 평가하고 다양한 수업 요구에 맞게 텍스트를 조정할 수 있는 확장 가능한 도구를 보유하지 못하고 있기 때문에 여전히 도전 과제로 남아 있다. 본 연구는 트랜스포머 기반 텍스트 분류와 언어학적 특성 분석을 결합한 다모달 접근 방식을 통해 이 격차를 해소하고자 한다. 이는 영국의 학년 단계(Key Stages)에 맞춰 텍스트를 일치시키는 것을 목표로 한다. 8종의 최신 트랜스포머 모델이 분할된 텍스트 데이터를 기반으로 미세 조정되었으며, BERT 모델이 단일 모달에서 가장 높은 F1 점수(0.75)를 기록했다. 병렬적으로, 언어학적 특성 분류를 위한 500개의 심층 신경망 아키텍처가 탐색되었으며, 이는 F1 점수 0.392를 달성했다. 이러한 다양한 모달의 융합은 상당한 성능 향상을 보였으며, 모든 다모달 접근 방식이 단일 모달 모델보다 우수한 성능을 보였다. 특히, ELECTRA 트랜스포머와 신경망을 융합한 모델은 F1 점수 0.996을 기록하며 뛰어난 성능을 입증했다. 단일 모달과 다모달 접근 방식은 정확도, 정밀도, 재현율, F1 점수를 포함한 모든 검증 지표에서 통계적으로 유의미한 차이를 보였으며, 유일하게 추론 시간에서는 차이가 없었다. 본 연구에서 제안하는 접근 방식은 최종적으로 이해관계자 중심의 웹 애플리케이션으로 구현되었으며, 비기술적 이해관계자들이 텍스트의 복잡성, 독해 난이도, 교육 과정 일치도, 학습 연령 범위 추천 등에 대해 실시간 인사이트를 확인할 수 있도록 지원한다. 이 애플리케이션은 영어 문학 수업 기획에 인공지능 기반 추천을 통합함으로써 데이터 기반 의사결정을 촉진하고 수동 작업 부담을 줄이는 데 기여한다.