11日前

ポイントワイズV情報を利用した意図検出のための選択的コンテキスト内データ拡張

Yen-Ting Lin, Alexandros Papangelis, Seokhwan Kim, Sungjin Lee, Devamanyu Hazarika, Mahdi Namazifar, Di Jin, Yang Liu, Dilek Hakkani-Tur
ポイントワイズV情報を利用した意図検出のための選択的コンテキスト内データ拡張
要約

本研究は、意図検出(intent detection)におけるコンテキスト内データ拡張(in-context data augmentation)に焦点を当てる。大規模事前学習言語モデル(PLM)を用いたコンテキスト内プロンプティングによるデータ拡張だけでは性能向上が見られないことを確認した後、PLMと点ごとのV情報量(PVI:pointwise V-information)を組み合わせた新しいアプローチを提案する。PVIは、あるデータポイントがモデルの学習にどの程度有用であるかを測定可能な指標である。本手法は、まず少量の初期学習データ上でPLMをファインチューニングし、その後、特定の意図に対応する新たな発話(utterance)を合成する。続いて、PVIに基づく意図に特化したフィルタリングを実施し、下流の意図分類器の学習に貢献しないデータポイントを除去する。このようにして、本手法は大規模言語モデルの表現力を利用し、多様な訓練データを生成することが可能となる。実証的な結果から、本手法は3つの困難な意図検出データセットにおいて、少サンプル(few-shot)設定下で最先端の性能を達成し、5ショットでは平均1.28%、10ショットでは平均1.18%の絶対的な性能向上を実現した。また、フルショット(full-shot)設定下では、最先端手法と同等の性能を発揮し(平均で0.01%以内の差異)、競合する手法と比較しても劣らない結果を示した。

ポイントワイズV情報を利用した意図検出のための選択的コンテキスト内データ拡張 | 最新論文 | HyperAI超神経