
要約
アスペクトセンチメントクアッド予測(ASQP)は、テキスト内のアスペクト語、意見語、センチメント極性、およびアスペクトカテゴリを分析するタスクである。このタスクにおける大きな課題の一つは、高コストなラベル付けに起因するデータの不足である。この問題に対処するために、データ拡張技術が一般的に用いられている。しかし、従来のアプローチは訓練データ内のテキストを単に再表現するにとどまっており、生成データの意味的多様性が制限され、テキストとクアッド(四項組)の間に一貫性が欠けるため、品質が低下するという問題がある。これらの制約を克服するため、本研究ではクアッドを拡張し、クアッドからテキストを生成するモデルを学習する手法を提案する。さらに、低品質なデータを効果的に除外するための新たな戦略と、拡張データセットにおけるサンプルの難易度分布のバランスを調整する戦略を設計した。2つのASQPデータセットを用いた実証実験の結果、本手法は他のデータ拡張手法を上回り、ベンチマークにおいて最先端の性能を達成した。