
要約
私たちは、カスタマーレビューの文章を階層的な離散潜在空間にエンコードし、そのエンコードの頻度に基づいて一般的な意見を特定する、教師なし意見要約の手法を提案します。この手法により、頻繁に現れるエンコードをデコーディングすることで抽象的な要約を生成し、同じ頻繁なエンコードに割り当てられた文章を選択することで抽出的な要約を生成することが可能です。当手法は属性が明確であり、モデルが要約生成プロセスの一環として使用された文章を特定するためです。また、集約処理が長いトークン列ではなく潜在空間で行われるため、数百件の入力レビューにも容易にスケールアップできます。さらに、当アプローチは一定程度の制御性も有しており、モデルを所望の側面(例:立地や料理)に対応するエンコード空間の部分に制限することで、側面固有の要約を生成することができます。異なる2つのデータセットにおける自動評価と人間による評価により、当手法が従来の研究よりも情報量が多く、入力レビューに基づいたより良い要約を生成することを示しています。