11일 전

연령 기반 텍스트 분류를 위한 특징 유형에 관한 비교 연구

Anna Glazkova, Yury Egorov, Maksim Glazkov
연령 기반 텍스트 분류를 위한 특징 유형에 관한 비교 연구
초록

소설의 대상 연령층을 자동으로 판단할 수 있는 능력은 정보 검색 도구 개발에 다양한 기회를 제공한다. 먼저, 책 추천 시스템 및 전자 도서관 개발자들은 가장 가능성이 높은 독자의 연령대에 따라 텍스트를 필터링하는 데 관심을 가질 수 있다. 또한, 부모들은 자녀용 문학 작품을 선택하고자 할 수 있다. 마지막으로, 작가와 출판사에게는 텍스트가 어린이용으로 적합한지 여부에 영향을 미치는 요소를 파악하는 데 유용할 것이다. 본 논문에서는 소설 텍스트의 연령 기반 분류 작업에 있어 다양한 언어적 특징의 실증적 효과를 비교한다. 이를 위해 어린이용 또는 성인용 중 하나의 카테고리로 레이블링된 책 소개 텍스트 코퍼스를 수집하였다. 평가 대상 특징으로는 독해도 지표, 감정 분석, 어휘적 특징, 문법적 특징, 일반적 특징 및 출판 관련 속성 등을 포함하였다. 그 결과, 문서 수준에서 텍스트를 설명하는 특징들이 기계 학습 모델의 성능을 상당히 향상시킬 수 있음을 확인하였다.

연령 기반 텍스트 분류를 위한 특징 유형에 관한 비교 연구 | 최신 연구 논문 | HyperAI초신경