16日前
潜在空間におけるODEを用いた合成可能なテキスト制御
Guangyi Liu, Zeyu Feng, Yuan Gao, Zichao Yang, Xiaodan Liang, Junwei Bao, Xiaodong He, Shuguang Cui, Zhen Li, Zhiting Hu

要約
現実世界におけるテキスト処理アプリケーションでは、属性に基づくテキスト編集、キーワードや構造の操作、望ましい性質を持つ新しいテキストの生成など、多様なテキスト制御操作の組み合わせがしばしば必要となる。従来の手法は、個々の操作または特定の操作サブセットに対して言語モデル(LM)を学習またはファインチューニングする方法に依存していた。近年の研究では、複数の操作をプラグアンドプレイ形式で統合するアプローチが検討されているが、複雑なシーケンス空間における高コストな探索や最適化を伴うことが一般的である。本論文では、テキストのコンパクトな潜在空間における組み合わせ可能なテキスト操作のための新たな効率的アプローチを提案する。テキスト潜在ベクトルの低次元性と微分可能性を活かし、任意のプラグイン型オペレータ(例:属性分類器)を用いて常微分方程式(ODE)に基づく効率的なサンプラーを構築できる。さらに、効率的な適応手法を介して事前学習済みLM(例:GPT-2)を潜在空間に接続することで、サンプリングされたベクトルを望ましいテキストシーケンスに復号化する。本手法は、異なるドメインからの関連データを用いて取得可能な多様な制御オペレータ(感情、時制、フォーマルさ、キーワードなど)を柔軟に扱える点が特徴である。実験の結果、本アプローチ内でこれらのオペレータを組み合わせることで、高品質なテキスト生成や編集が可能となり、従来の手法に比べて生成品質および効率性において顕著な向上が確認された。