日付

8ヶ月前

サイズ

1.86 MB

タグ

vLLM

ライセンス

Apache 2.0

GitHub

OpenBMB/MiniCPM/

論文URL

2506.07900

1. チュートリアルの概要

OpenBMBが2025年6月6日にリリースしたMiniCPM 4.0は、高性能なエッジサイド大規模言語モデル（LLM）です。スパースアーキテクチャ、量子化圧縮、そして効率的な推論フレームワークにより、低い計算コストで高性能な推論を実現し、長文テキスト処理、プライバシーに配慮したシナリオ、そしてエッジコンピューティングデバイスの導入に特に適しています。MiniCPM4-8Bは、長いシーケンスの処理においてQwen3-8Bと比較して大幅に高速な処理速度を実証しています。関連研究論文もご覧いただけます。 MiniCPM4: エンドデバイス上の超高効率LLM 。

このチュートリアルでは、単一の RTX 4090 カードのリソースを使用します。

2. プロジェクト例

3. 操作手順

1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

2. Web ページに入ると、モデルと会話を開始できます。

「モデル」が表示されない場合は、モデルが初期化中です。モデルのサイズが大きいため、2～3分ほどお待ちいただき、ページを更新してください。

利用手順

4. 議論

🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。

引用情報

Githubユーザーに感謝 xxxjjjyyy1 このチュートリアルの展開。このプロジェクトの引用情報は次のとおりです。

@article{minicpm4,
  title={MiniCPM4: Ultra-Efficient LLMs on End Devices},
  author={MiniCPM Team},
  year={2025}
}

@inproceedings{huminicpm,
  title={MiniCPM: Unveiling the Potential of Small Language Models with Scalable Training Strategies},
  author={Hu, Shengding and Tu, Yuge and Han, Xu and Cui, Ganqu and He, Chaoqun and Zhao, Weilin and Long, Xiang and Zheng, Zhi and Fang, Yewei and Huang, Yuxiang and others},
  booktitle={First Conference on Language Modeling},
  year={2024}
}

このノートブックはコミュニティユーザーによって提供されたものであり、教育および情報提供のみを目的としています。コンテンツに著作権侵害が含まれる場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

このNotebookを実行 Discordで議論

日付

8ヶ月前

サイズ

1.86 MB

タグ

vLLM

ライセンス

Apache 2.0

GitHub

OpenBMB/MiniCPM/

論文URL

2506.07900

1. チュートリアルの概要

このチュートリアルでは、単一の RTX 4090 カードのリソースを使用します。

2. プロジェクト例

3. 操作手順

1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

2. Web ページに入ると、モデルと会話を開始できます。

「モデル」が表示されない場合は、モデルが初期化中です。モデルのサイズが大きいため、2～3分ほどお待ちいただき、ページを更新してください。

利用手順

4. 議論

引用情報

Githubユーザーに感謝 xxxjjjyyy1 このチュートリアルの展開。このプロジェクトの引用情報は次のとおりです。

@article{minicpm4,
  title={MiniCPM4: Ultra-Efficient LLMs on End Devices},
  author={MiniCPM Team},
  year={2025}
}

@inproceedings{huminicpm,
  title={MiniCPM: Unveiling the Potential of Small Language Models with Scalable Training Strategies},
  author={Hu, Shengding and Tu, Yuge and Han, Xu and Cui, Ganqu and He, Chaoqun and Zhao, Weilin and Long, Xiang and Zheng, Zhi and Fang, Yewei and Huang, Yuxiang and others},
  booktitle={First Conference on Language Modeling},
  year={2024}
}

Open-AutoGLM: モバイルデバイス向けスマートアシスタント

2ヶ月前

vLLM+Open WebUI を使用した QwenLong-L1.5 のデプロイ

1ヶ月前

vLLM+Open WebUIを使用してIQuest-Coder-V1をデプロイする

1ヶ月前

vLLM+Open WebUI 導入機能Gemma-270m-it

21日前

vLLM+Open WebUIを使用したLFM2.5-1.2B-Thinkingの導入

8日前

vLLM+Open WebUIを使用してGLM-4.7-Flashを展開する

8日前

vLLM+Open WebUI が Nemotron-3 Nano を導入

19日前

vLLM+OpenWebUIを使用したVibeThinker-1.5Bのデプロイ

3ヶ月前

PaddleOCR-VL: マルチモーダルドキュメント解析

3ヶ月前

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

Command Palette

vLLM+Open WebUI 導入 MiniCPM4-8B

1. チュートリアルの概要

2. プロジェクト例

3. 操作手順

4. 議論

引用情報

AIでAIを構築

HyperAI Newsletters

Command Palette

vLLM+Open WebUI 導入 MiniCPM4-8B

1. チュートリアルの概要

2. プロジェクト例

3. 操作手順

4. 議論

引用情報

関連 ノートブック

Open-AutoGLM: モバイルデバイス向けスマートアシスタント

vLLM+Open WebUI を使用した QwenLong-L1.5 のデプロイ

vLLM+Open WebUIを使用してIQuest-Coder-V1をデプロイする

vLLM+Open WebUI 導入機能Gemma-270m-it

vLLM+Open WebUIを使用したLFM2.5-1.2B-Thinkingの導入

vLLM+Open WebUIを使用してGLM-4.7-Flashを展開する

vLLM+Open WebUI が Nemotron-3 Nano を導入

vLLM+OpenWebUIを使用したVibeThinker-1.5Bのデプロイ

PaddleOCR-VL: マルチモーダルドキュメント解析

AIでAIを構築

HyperAI Newsletters

Command Palette

vLLM+Open WebUI 導入 MiniCPM4-8B

1. チュートリアルの概要

2. プロジェクト例

3. 操作手順

4. 議論

引用情報

関連 ノートブック

Open-AutoGLM: モバイルデバイス向けスマートアシスタント

vLLM+Open WebUI を使用した QwenLong-L1.5 のデプロイ

vLLM+Open WebUIを使用してIQuest-Coder-V1をデプロイする

vLLM+Open WebUI 導入機能Gemma-270m-it

vLLM+Open WebUIを使用したLFM2.5-1.2B-Thinkingの導入

vLLM+Open WebUIを使用してGLM-4.7-Flashを展開する

vLLM+Open WebUI が Nemotron-3 Nano を導入

vLLM+OpenWebUIを使用したVibeThinker-1.5Bのデプロイ

PaddleOCR-VL: マルチモーダルドキュメント解析

AIでAIを構築

HyperAI Newsletters

関連 ノートブック

Open-AutoGLM: モバイルデバイス向けスマートアシスタント

vLLM+Open WebUI を使用した QwenLong-L1.5 のデプロイ

vLLM+Open WebUIを使用してIQuest-Coder-V1をデプロイする

vLLM+Open WebUI 導入機能Gemma-270m-it

vLLM+Open WebUIを使用したLFM2.5-1.2B-Thinkingの導入

vLLM+Open WebUIを使用してGLM-4.7-Flashを展開する

vLLM+Open WebUI が Nemotron-3 Nano を導入

vLLM+OpenWebUIを使用したVibeThinker-1.5Bのデプロイ

PaddleOCR-VL: マルチモーダルドキュメント解析

関連 ノートブック

Open-AutoGLM: モバイルデバイス向けスマートアシスタント

vLLM+Open WebUI を使用した QwenLong-L1.5 のデプロイ

vLLM+Open WebUIを使用してIQuest-Coder-V1をデプロイする

vLLM+Open WebUI 導入機能Gemma-270m-it

vLLM+Open WebUIを使用したLFM2.5-1.2B-Thinkingの導入

vLLM+Open WebUIを使用してGLM-4.7-Flashを展開する

vLLM+Open WebUI が Nemotron-3 Nano を導入

vLLM+OpenWebUIを使用したVibeThinker-1.5Bのデプロイ

PaddleOCR-VL: マルチモーダルドキュメント解析

関連ノートブック

関連ノートブック

関連ノートブック

関連ノートブック