HyperAIHyperAI

Command Palette

Search for a command to run...

シーケンス尤度のキャリブレーションは、条件付き言語生成を改善する

Yao Zhao Misha Khalman Rishabh Joshi Shashi Narayan Mohammad Saleh Peter J. Liu

概要

条件付き言語モデルは主に最尤推定(MLE)により訓練され、観測頻度が低いターゲット系列に確率質量を割り当てることになる。MLEで訓練されたモデルは、文脈を前提とした妥当な系列に高い確率を割り当てるが、生成された系列の品質を正確に順位付けする確率分布を提供するとは限らない。これは、ビームサーチによるデコードにおいてビームサイズが大きくなるにつれて出力品質が低下するという実証的な観察からも明らかであり、長さ正規化や繰り返しブロッキングといったヒューリスティクスを用いたデコード戦略の有効性も示唆している。本研究では、モデルが生成する系列の尤度を、モデルの潜在空間における参照系列とより整合性を持たせる「系列尤度の補正(Sequence Likelihood Calibration: SLiC)」を提案する。SLiCを導入することで、従来必要とされてきたデコードのヒューリスティクスは不要となり、どのデコード手法を用いても生成候補の品質が顕著に向上する。さらに、モデル規模が増大しても、SLiCは収束効果の減少(diminishing returns)を示さず、限られた学習および推論リソースでも品質向上の新たな手段を提供する。SLiCを用いることで、要約生成、質問生成、要約型質問応答、データからテキスト生成に至る幅広い生成タスクにおいて、SOTA(最良の既存手法)を上回るか、あるいは同等の性能を達成でき、モデルサイズが比較的小規模な場合でもその有効性が確認された。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています