18日前
SemEval-2017 タスク4におけるDataStories:メッセージレベルおよびトピックベースのセンチメント分析のためのDeep LSTMとアテンション
{Christos Doulkeridis, Christos Baziotis, Nikos Pelekis}

要約
本稿では、SemEval-2017 タスク4「Twitterにおける感情分析」に参加した2つのディープラーニングシステムを紹介する。我々は英語のツイートに関するすべてのサブタスクに参加し、メッセージレベルおよびトピックベースの感情極性分類および感情の定量化を実施した。本手法では、大規模なツイートデータコールレクション上で事前学習された単語埋め込み(word embeddings)を基盤とし、長短期記憶(LSTM)ネットワークに2種類のアテンション機構を組み合わせた構成を採用している。また、ソーシャルネットワークのメッセージに適したテキスト処理ツールを提案する。このツールは、トークン化、語の正規化、分割、スペル訂正を実行する。さらに、本アプローチは手動で設計された特徴量や感情語彙(sentiment lexicons)を一切使用していない。結果として、サブタスクAでは1位(タイ)を獲得し、他のサブタスクにおいても非常に競争力のある成績を収めた。本研究で使用した単語埋め込みおよびテキスト処理ツールは、研究コミュニティの皆様に公開されている。