
要約
レビュー分析の文脈において、アスペクトとは製品やサービスの特徴を指し、顧客がその意見や感情を対象とするものです。アスペクト検出は製品オーナーやサービス提供者が欠点を特定し、顧客のニーズを優先することで収益を維持し、顧客離れを軽減するのに役立ちます。既存の方法では、監督学習手法を使用してアスペクトの表面的な形態を検出することに焦点が当てられていますが、レビュー内でアスペクトが潜在的な場合には不十分です。本論文では、潜在的なアスペクトの出現を抽出するための非監督的手法を提案します。具体的には、顧客がレビューを書く際には仮想的な二段階生成プロセスを経るという前提を取り入れています。(1) 製品またはサービスで利用可能なアスペクト群から特定のアスペクトを選択し、(2) その言語で利用可能なすべての単語の中から選択されたアスペクトとより密接に関連した意見表現の単語を書くというプロセスです。我々は潜在ディリクレ割当(Latent Dirichlet Allocation)を使用して、レビュー生成のために潜在的なアスペクト分布を学習します。ベンチマークデータセットでの実験結果は、我々が提案する手法がレビュー内に表面的な形態がない潜在的なアスペクトに対して最先端の成果を超えることができることを示しています。