
要約
深層学習に基づく汎用言語モデルは、センチメント分析や質問応答(QA)タスクなど、多くの代表的なタスクにおいて最先端の性能を達成している。ソーシャルメディアなど特定のドメインにおけるテキストは、独自の顕著な特徴を持つ。そのため、ドメイン固有のタスクにおいては、ドメイン知識の活用が有効であると考えられる。本研究では、ドメイン知識を簡便に取得する手法を提案し、さらに深層言語モデルを基盤として、ドメイン知識と汎用知識を統合する手法を設計することで、感情分類の性能向上を図った。ツイッターデータを用いた実験の結果、ターゲットドメインデータで微調整された深層言語モデルは、従来の最先端モデルと同等の性能を達成しているものの、本研究で抽出したドメイン知識を導入することでさらなる性能向上が実現された。これは、ドメイン固有のアプリケーションにおいてドメイン知識を活用することの重要性を示している。