
要約
既存の機械学習技術は、テキストベースの分類タスクにおいて人間の性能に近い結果を示しています。しかし、絵文字、スラング、スペリングミス、コードミックスデータなどの多様なノイズがチャットデータに存在することにより、既存の深層学習ソリューションの性能は著しく低下します。深層学習システムがこれらの共変量を堅牢に捉えられないことから、その性能には限界があります。本研究では、NELEC(Neural and Lexical Combiner)と呼ばれるシステムを提案します。このシステムは、感情分類のためにテキストベースの手法と深層学習ベースの手法を優雅に組み合わせています。我々は、SemEval-2019 の「テキストにおける文脈的感情検出」第3タスクの一環として、本システムを評価しました。評価結果によると、本システムは基準モデルや我々自身の深層学習モデルのベンチマークよりも有意に優れた性能を示し、マイクロ平均F1スコアで0.7765を達成し、テストセットのリーダーボードで3位となりました。本研究のコードは https://github.com/iamgroot42/nelec で公開されています。