HyperAIHyperAI

Command Palette

Search for a command to run...

vLLM + オープン WebUI の導入 gemma-3-270m-it

Date

5ヶ月前

Size

1.7 MB

Tags

License

Other

Paper URL

arxiv.org

1. チュートリアルの概要

gemma-3-270m-itは、Googleが2025年3月12日にリリースしたGemma 3シリーズの軽量命令微調整モデルです。2億7000万個のパラメータで構築され、効率的な対話インタラクションと軽量なデプロイメントに重点を置いています。この軽量で効率的なモデルは、単一のGPUで1GB以上のVRAMしか必要としないため、エッジデバイスや低リソースのシナリオに適しています。マルチターン対話をサポートし、日常的な質疑応答や簡単なタスク指示に特化した微調整が施されています。テキスト生成と理解に重点を置いています(画像などのマルチモーダル入力はサポートしていません)。また、32Kトークンのコンテキストウィンドウをサポートし、長いテキスト対話を処理できます。関連研究論文も入手可能です。 Gemma 3 技術レポート

このチュートリアルでは、単一の RTX 4090 カードのリソースを使用します。

2. プロジェクト例

3. 操作手順

1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

2. Web ページに入ると、モデルと会話を開始できます。

「モデル」が表示されない場合は、モデルが初期化中です。モデルのサイズが大きいため、2~3分ほどお待ちいただき、ページを更新してください。

利用手順

4. 議論

🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。

引用情報

このプロジェクトの引用情報は次のとおりです。

@article{gemma_2025,
    title={Gemma 3},
    url={https://arxiv.org/abs/2503.19786},
    publisher={Google DeepMind},
    author={Gemma Team},
    year={2025}
}

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています