要約
本稿では、ユーザ生成レビューから重要なインサイトを抽出するための手法を提案する。本研究は、テキストドキュメントに言及される要素(アスペクト)の感情を予測する「アスペクトベース感情分析(ABSA)」に基づいている。抽出されたアスペクトは、レビューの要約形式として知られる「Review Highlights」として、細分化された形で提示される。従来の構文論的抽出手法は、重複するチャンキング規則に起因するノイズの抽出を引き起こすという課題を抱えていた。本研究では、機械学習モデルとルールベースモデルを統合したハイブリッド手法を導入する。多ラベル分類器により、テキストからアスペクトと意見を効果的に解析するための適切な規則を特定する。この規則選択により、抽出タスクにおけるノイズ量が顕著に削減される。本研究は、コーパスを用いて機械学習により構文規則の適合性を学習することで、正確なアスペクト抽出を実現するという、新たな試みである。モデルがコーパスから構文規則の予測を学習するため、抽出手法はドメインに依存しなくなる。また、異なるコーパスにおける構文規則の品質を評価・分析する可能性も開かれる。