11日前

シーケンス尤度のキャリブレーションは、条件付き言語生成を改善する

Yao Zhao, Misha Khalman, Rishabh Joshi, Shashi Narayan, Mohammad Saleh, Peter J. Liu
シーケンス尤度のキャリブレーションは、条件付き言語生成を改善する
要約

条件付き言語モデルは主に最尤推定(MLE)により訓練され、観測頻度が低いターゲット系列に確率質量を割り当てることになる。MLEで訓練されたモデルは、文脈を前提とした妥当な系列に高い確率を割り当てるが、生成された系列の品質を正確に順位付けする確率分布を提供するとは限らない。これは、ビームサーチによるデコードにおいてビームサイズが大きくなるにつれて出力品質が低下するという実証的な観察からも明らかであり、長さ正規化や繰り返しブロッキングといったヒューリスティクスを用いたデコード戦略の有効性も示唆している。本研究では、モデルが生成する系列の尤度を、モデルの潜在空間における参照系列とより整合性を持たせる「系列尤度の補正(Sequence Likelihood Calibration: SLiC)」を提案する。SLiCを導入することで、従来必要とされてきたデコードのヒューリスティクスは不要となり、どのデコード手法を用いても生成候補の品質が顕著に向上する。さらに、モデル規模が増大しても、SLiCは収束効果の減少(diminishing returns)を示さず、限られた学習および推論リソースでも品質向上の新たな手段を提供する。SLiCを用いることで、要約生成、質問生成、要約型質問応答、データからテキスト生成に至る幅広い生成タスクにおいて、SOTA(最良の既存手法)を上回るか、あるいは同等の性能を達成でき、モデルサイズが比較的小規模な場合でもその有効性が確認された。

シーケンス尤度のキャリブレーションは、条件付き言語生成を改善する | 最新論文 | HyperAI超神経