Command Palette
Search for a command to run...
vLLM + オープン WebUI の導入 gemma-3-270m-it
1. チュートリアルの概要
gemma-3-270m-itは、Googleが2025年3月12日にリリースしたGemma 3シリーズの軽量命令微調整モデルです。2億7000万個のパラメータで構築され、効率的な対話インタラクションと軽量なデプロイメントに重点を置いています。この軽量で効率的なモデルは、単一のGPUで1GB以上のVRAMしか必要としないため、エッジデバイスや低リソースのシナリオに適しています。マルチターン対話をサポートし、日常的な質疑応答や簡単なタスク指示に特化した微調整が施されています。テキスト生成と理解に重点を置いています(画像などのマルチモーダル入力はサポートしていません)。また、32Kトークンのコンテキストウィンドウをサポートし、長いテキスト対話を処理できます。関連研究論文も入手可能です。 Gemma 3 技術レポート 。
このチュートリアルでは、単一の RTX 4090 カードのリソースを使用します。
2. プロジェクト例

3. 操作手順
1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

2. Web ページに入ると、モデルと会話を開始できます。
「モデル」が表示されない場合は、モデルが初期化中です。モデルのサイズが大きいため、2~3分ほどお待ちいただき、ページを更新してください。
利用手順

4. 議論
🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。

引用情報
このプロジェクトの引用情報は次のとおりです。
@article{gemma_2025,
title={Gemma 3},
url={https://arxiv.org/abs/2503.19786},
publisher={Google DeepMind},
author={Gemma Team},
year={2025}
}Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.