HyperAIHyperAI

Command Palette

Search for a command to run...

IntrEx: 교육 대화의 참여를 모델링하기 위한 데이터셋

Xingwei Tan Mahathi Parvatham Chiara Gambi Gabriele Pergola

초록

학습자의 참여도와 동기부여는 제2언어 습득에 있어 핵심적인 요소이지만, 교육적 대화에서 학습자의 관심을 지속적으로 유지하는 것은 여전히 도전 과제이다. 기존 연구들은 교육적 텍스트가 어떻게 흥미로운지를 탐구해 왔으나, 대화 상황에서 참여를 유도하는 언어적 특성에 대해서는 여전히 미지의 영역이다. 이러한 연구 공백을 메우기 위해, 본 연구는 교사-학생 상호작용에서의 흥미로움과 예상되는 흥미로움을 주석화한 최초의 대규모 데이터셋인 IntrEx를 제안한다. IntrEx는 Teacher-Student Chatroom Corpus(TSCC)를 기반으로 하며, 이전 연구를 확장하여 시퀀스 수준의 주석을 포함함으로써, 단일 대화 구절을 넘어서 장기간 대화 내에서 관심이 어떻게 변화하는지를 탐구할 수 있도록 한다. 본 연구는 100명 이상의 제2언어 학습자를 대상으로 체계적인 주석 과정을 수행하였으며, 인간 피드백 기반 강화학습(RLHF)의 아이디어를 차용한 비교 기반 평가 방식을 활용하여 주석자 간 일치도를 향상시켰다. 또한 대규모 언어 모델(LLM)이 인간의 흥미로움 평가를 예측할 수 있는지 여부를 검토하였다. 그 결과, 흥미로움 평가 데이터로 미세조정된 LLM(7B/8B 파라미터)이 GPT-4o와 같은 더 큰 전용 모델보다 뛰어난 성능을 보였으며, 이는 전문화된 데이터셋이 교육적 맥락에서의 참여도를 모델링하는 데 유용할 수 있음을 시사한다. 마지막으로, 구체성, 이해 가능성(독해 용이성), 그리고 언어적 반응(uptake)과 같은 언어적 및 인지적 요인이 교육적 대화에서의 참여도에 미치는 영향을 분석하였다.


AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
IntrEx: 교육 대화의 참여를 모델링하기 위한 데이터셋 | 문서 | HyperAI초신경