HyperAIHyperAI

Command Palette

Search for a command to run...

Prompt2Model:自然言語による指示からデプロイ可能なモデルを生成する

Vijay Viswanathan Chenyang Zhao Amanda Bertsch Tongshuang Wu Graham Neubig

概要

大規模言語モデル(LLM)は、システム構築者がプロンプトを用いることで、自然言語でタスクを記述し、少数の例を提示するだけで効果的な自然言語処理(NLP)システムを構築できるようにしている。しかし、他の側面では、従来の専用NLPモデルに比べて一歩後退していると言える。LLMは導入に膨大な計算リソースを要し、APIを介してのみ利用可能になる場合もあるため、実装の柔軟性に制約がある。本論文では、LLMに提示されるような自然言語によるタスク記述を入力として受け取り、それをもとに展開に適した専用モデルを学習する汎用的手法「Prompt2Model」を提案する。この手法は、既存のデータセットおよび事前学習済みモデルの検索、LLMを用いたデータセットの生成、およびこれらの検索・生成されたデータセットに基づく教師あり微調整という複数ステップのプロセスを経て実現される。3つのタスクにおいて、同じ少サンプルプロンプトを入力として与えた場合、Prompt2Modelが学習するモデルは、強力なLLMであるgpt-3.5-turboの性能を平均20%上回り、モデルサイズは最大で700分の1まで削減できることが実証された。さらに、本手法で得られるデータを用いることで、モデルの性能に対する信頼性の高い推定が可能となり、開発者は実装前にモデルの信頼性を評価できるようになる。Prompt2Modelは、GitHub上でオープンソースとして公開されており、https://github.com/neulab/prompt2model から利用可能である。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
Prompt2Model:自然言語による指示からデプロイ可能なモデルを生成する | 記事 | HyperAI超神経