18일 전

SemEval-2017 Task 4에서의 DataStories: 메시지 수준 및 주제 기반 감성 분석을 위한 깊은 LSTM과 어텐션

{Christos Doulkeridis, Christos Baziotis, Nikos Pelekis}
SemEval-2017 Task 4에서의 DataStories: 메시지 수준 및 주제 기반 감성 분석을 위한 깊은 LSTM과 어텐션
초록

이 논문에서는 SemEval-2017 Task 4 “Twitter에서의 감성 분석”에 참가한 두 가지 딥러닝 시스템을 제안한다. 우리는 영어 트윗에 대한 모든 하위 과제에 참여하였으며, 메시지 수준 및 주제 기반 감성 극성 분류와 정량화를 포함한다. 본 연구에서는 대규모 트윗 메시지 컬렉션을 기반으로 사전 훈련된 워드 임베딩 위에, 두 가지 유형의 어텐션 메커니즘을 보완한 장단기 기억망(LSTM)을 사용한다. 또한, 소셜 네트워크 메시지에 적합한 텍스트 전처리 도구를 제시하며, 이는 토큰화, 단어 정규화, 분절 및 철자 검사 기능을 수행한다. 더욱이, 본 접근법은 수작업으로 설계한 특징이나 감성 사전을 사용하지 않는다. 우리는 하위 과제 A에서 1위(동점)를 기록하였으며, 나머지 하위 과제에서도 매우 경쟁력 있는 성과를 달성하였다. 제안한 워드 임베딩 및 텍스트 전처리 도구는 연구 공동체에 공개되어 활용 가능하다.