HyperAIHyperAI

Command Palette

Search for a command to run...

REPLUG: 検索強化型ブラックボックス言語モデル

Weijia Shi; Sewon Min; Michihiro Yasunaga; Minjoon Seo; Rich James; Mike Lewis; Luke Zettlemoyer; Wen-tau Yih

概要

REPLUGという検索強化型言語モデルフレームワークを紹介します。このフレームワークは、言語モデル(LM)をブラックボックスとみなし、調整可能な検索モデルでそれを補完します。従来の検索強化型LMは、特殊なクロスアテンションメカニズムを使用して取得したテキストをエンコードするための言語モデルの訓練が必要でしたが、REPLUGは凍結されたブラックボックスLMへの入力に取得したドキュメントを単純に前置するだけで済みます。この単純な設計は、既存の任意の検索モデルや言語モデルに容易に適用できます。さらに、我々はLMが検索モデルの監督に使用できることを示し、これによりLMがより良い予測を行うために役立つドキュメントを見つけることができます。実験結果では、調整された検索器を使用したREPLUGがGPT-3(175B)の言語モデリング性能を6.3%向上させるとともに、Codexの5ショットMMLUでの性能も5.1%向上させることを確認しました。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています