11일 전
업무 지향적 워드 임베딩을 활용한 텍스트 분류
{He-Yan Huang, Yang Gao, Qian Liu, Yuxin Tian, Xiaochi Wei, Luyang Liu}

초록
분산형 단어 표현은 다양한 자연어 처리 작업에서 핵심적인 역할을 한다. 기존의 많은 방법들이 성공을 거두고 있음에도 불구하고, 대부분의 기법들은 맥락 정보만을 고려하고 있어, 작업 특화된 특징이 부족함으로 인해 다양한 작업에 적용될 때 최적의 성능을 발휘하지 못한다. 합리적인 단어 임베딩은 단어의 의미적 특징뿐 아니라 작업에 특화된 특징도 포착할 수 있어야 한다. 본 논문에서는 작업 중심의 단어 임베딩 방법을 제안하고, 이를 텍스트 분류 작업에 적용한다. 함수 인식 기능을 갖춘 구성 요소를 통해 본 방법은 단어의 분포를 정규화하여 임베딩 공간이 명확한 분류 경계를 가지도록 한다. 제안한 방법은 다섯 개의 텍스트 분류 데이터셋을 활용하여 평가되었으며, 실험 결과 본 방법이 최신 기술 대비 유의미하게 뛰어난 성능을 보였다.