18일 전

문서 수준 감성 분류를 위한 연쇄적 다중 방향 어텐션

{Xu sun, Dehong Ma, Houfeng Wang, Xiaodong Zhang, Sujian Li}
문서 수준 감성 분류를 위한 연쇄적 다중 방향 어텐션
초록

문서 수준 감성 분류는 사용자 리뷰에 감성 극성(긍정/부정)을 부여하는 것을 목표로 한다. 기존의 방법들은 사용자 및 제품 정보를 고려하지 않고 문서의 내용만을 활용하거나, 세 가지 정보(사용자, 제품, 문서 내용)가 텍스트 모델링에서 어떤 역할을 하는지 종합적으로 고려하지 못했다. 본 논문에서는 이러한 정보를 합리적으로 활용하기 위해, 사용자, 제품, 그리고 그 조합이 문서의 감성 판단 시 단어 및 문장에 대한 주의(attention) 생성에 모두 영향을 미칠 수 있다는 아이디어를 제안한다. 이 아이디어를 바탕으로, 사용자 및 제품 정보를 다양한 방식으로 활용한 주의 생성을 계단식으로 연결하여 단어 계층과 문장 계층의 주의 생성에 영향을 주는 계단형 다중 방향 주의(Cascading Multiway Attention, CMA) 모델을 제안한다. 이를 통해 다수의 표현 벡터를 활용하여 문장과 문서를 풍부한 정보를 포함하는 방식으로 효과적으로 모델링할 수 있으며, 감성 분류에 유리한 특징을 제공한다. IMDB 및 Yelp 데이터셋에서 수행한 실험을 통해 제안하는 모델의 효과성을 입증하였다.