17日前

FABSA:ユーザーレビューに基づくアスペクトベースセンチメント分析データセット

{Aji Ghose, Hassan Tahir, Patrycja Sliwiak, Thomas Metcalfe, Georgia Harrison, Jordan Clive, Georgios Kontonatsios}
要約

Aspect-based sentiment analysis(ABSA)は、エンティティの側面(aspect)を自動抽出し、抽出された各側面の極性(ポジティブ/ネガティブなど)を分類することを目的としています。現存する大多数のABSAシステムは、教師あり機械学習モデルの学習に手動でラベル付けされたデータセットに大きく依存しています。しかし、こうした手動ラベリングデータセットの構築は人的負担が大きく、結果として既存のABSAデータセットは領域が限定的であり、規模も小さくなっています。こうした課題に対応して、本研究ではフィードバックレビューを対象とした大規模かつ多領域にわたるABSAデータセット「FABSA(Feedback ABSA)」を提案します。FABSAは10の異なる領域にまたがる約10,500件のレビューから構成されています。本研究では、最先端の深層学習モデルをFABSAデータセットに適用した際の性能を評価するため、多数の実験を実施しました。その結果、FABSAデータセット上で学習させたABSAモデルは異なる領域間で一般化(汎化)が可能であることが示され、さらに大規模な学習データセットを使用することでモデルの性能が向上することが明らかになりました。本研究で提示するFABSAデータセットは、公開されています。