1. チュートリアルの概要

Phi-4-mini-flash-reasoningは、Microsoftチームがリリースした軽量なオープンソースモデルです。合成データに基づいて構築され、高品質で集中的な推論データに焦点を当て、さらに微調整することで、より高度な数学的推論機能を実現しています。このモデルはPhi-4モデルファミリーに属し、64Kのトークンコンテキスト長をサポートし、デコーダー・ハイブリッド・デコーダーアーキテクチャを採用し、アテンションメカニズムと状態空間モデル（SSM）を組み合わせることで、優れた推論効率を発揮します。関連研究論文もご覧いただけます。長い世代を持つ効率的な推論のためのデコーダーハイブリッドデコーダーアーキテクチャ。

このチュートリアルでは、RTX 4090カードを1枚使用します。プロジェクトプロンプトは中国語と英語に対応しています。

3. 操作手順

1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

2. 使用手順

「モデル」が表示されない場合は、モデルが初期化中です。モデルのサイズが大きいため、1～3分ほどお待ちいただき、ページを更新してください。

4. 議論

🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。

引用情報

このプロジェクトの引用情報は次のとおりです。

@software{archscale2025, title={ArchScale: Simple and Scalable Pretraining for Neural Architecture Research}, author={Liliang Ren and Zichong Li and Yelong Shen}, year={2025}, url={https://github.com/microsoft/ArchScale} }@article{ren2025decoder, title={Decoder-Hybrid-Decoder Architecture for Efficient Reasoning with Long Generation}, author={Liliang Ren and Congcong Chen and Haoran Xu and Young Jin Kim and Adam Atkinson and Zheng Zhan and Jiankai Sun and Baolin Peng and Liyuan Liu and Shuohang Wang and Hao Cheng and Jianfeng Gao and Weizhu Chen and Yelong Shen}, journal={arXiv preprint arXiv:2507.06607}, year={2025} }

HyperAI

このNotebookを実行

日付

6ヶ月前

サイズ

1.48 MB

タグ

マイクロソフト

ライセンス

MIT

GitHub

microsoft/ArchScale

論文URL

2507.06607

1. チュートリアルの概要

このチュートリアルでは、RTX 4090カードを1枚使用します。プロジェクトプロンプトは中国語と英語に対応しています。

2. プロジェクト例

3. 操作手順

1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

2. 使用手順

「モデル」が表示されない場合は、モデルが初期化中です。モデルのサイズが大きいため、1～3分ほどお待ちいただき、ページを更新してください。

4. 議論

引用情報

このプロジェクトの引用情報は次のとおりです。


@software{archscale2025,
  title={ArchScale: Simple and Scalable Pretraining for Neural Architecture Research},
  author={Liliang Ren and Zichong Li and Yelong Shen},
  year={2025},
  url={https://github.com/microsoft/ArchScale}
}

@article{ren2025decoder,
  title={Decoder-Hybrid-Decoder Architecture for Efficient Reasoning with Long Generation},
  author={Liliang Ren and Congcong Chen and Haoran Xu and Young Jin Kim and Adam Atkinson and Zheng Zhan and Jiankai Sun and Baolin Peng and Liyuan Liu and Shuohang Wang and Hao Cheng and Jianfeng Gao and Weizhu Chen and Yelong Shen},
  journal={arXiv preprint arXiv:2507.06607},
  year={2025}
}

このノートブックはコミュニティユーザーによって提供されたものであり、教育および情報提供のみを目的としています。コンテンツに著作権侵害が含まれる場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

このNotebookを実行

日付

6ヶ月前

サイズ

1.48 MB

タグ

マイクロソフト

ライセンス

MIT

GitHub

microsoft/ArchScale

論文URL

2507.06607

1. チュートリアルの概要

このチュートリアルでは、RTX 4090カードを1枚使用します。プロジェクトプロンプトは中国語と英語に対応しています。

2. プロジェクト例

3. 操作手順

1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

2. 使用手順

「モデル」が表示されない場合は、モデルが初期化中です。モデルのサイズが大きいため、1～3分ほどお待ちいただき、ページを更新してください。

4. 議論

引用情報

このプロジェクトの引用情報は次のとおりです。


@software{archscale2025,
  title={ArchScale: Simple and Scalable Pretraining for Neural Architecture Research},
  author={Liliang Ren and Zichong Li and Yelong Shen},
  year={2025},
  url={https://github.com/microsoft/ArchScale}
}

@article{ren2025decoder,
  title={Decoder-Hybrid-Decoder Architecture for Efficient Reasoning with Long Generation},
  author={Liliang Ren and Congcong Chen and Haoran Xu and Young Jin Kim and Adam Atkinson and Zheng Zhan and Jiankai Sun and Baolin Peng and Liyuan Liu and Shuohang Wang and Hao Cheng and Jianfeng Gao and Weizhu Chen and Yelong Shen},
  journal={arXiv preprint arXiv:2507.06607},
  year={2025}
}

vLLM+Open WebUIを使用してGLM-4.7-Flashを展開する

8日前

Fara-7B: 非常に効率的なWebベースのインテリジェントエージェントモデル

21日前

vLLM+Open WebUI を使用した QwenLong-L1.5 のデプロイ

1ヶ月前

vLLM+Open WebUIを使用してIQuest-Coder-V1をデプロイする

1ヶ月前

vLLM+Open WebUI 導入機能Gemma-270m-it

21日前

vLLM+Open WebUI が Nemotron-3 Nano を導入

19日前

vLLM+Open WebUIを使用したLFM2.5-1.2B-Thinkingの導入

8日前

F5-E2 TTS あらゆるサウンドをわずか 3 秒でクローン作成

2ヶ月前

vLLM+OpenWebUIを使用したVibeThinker-1.5Bのデプロイ

3ヶ月前

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

Command Palette

vLLM+Open WebUI の導入 Phi-4-mini-flash-reasoning

1. チュートリアルの概要

2. プロジェクト例

3. 操作手順

4. 議論

引用情報

AIでAIを構築

HyperAI Newsletters

Command Palette

vLLM+Open WebUI の導入 Phi-4-mini-flash-reasoning

1. チュートリアルの概要

2. プロジェクト例

3. 操作手順

4. 議論

引用情報

関連 ノートブック

vLLM+Open WebUIを使用してGLM-4.7-Flashを展開する

Fara-7B: 非常に効率的なWebベースのインテリジェントエージェントモデル

vLLM+Open WebUI を使用した QwenLong-L1.5 のデプロイ

vLLM+Open WebUIを使用してIQuest-Coder-V1をデプロイする

vLLM+Open WebUI 導入機能Gemma-270m-it

vLLM+Open WebUI が Nemotron-3 Nano を導入

vLLM+Open WebUIを使用したLFM2.5-1.2B-Thinkingの導入

F5-E2 TTS あらゆるサウンドをわずか 3 秒でクローン作成

vLLM+OpenWebUIを使用したVibeThinker-1.5Bのデプロイ

AIでAIを構築

HyperAI Newsletters

Command Palette

vLLM+Open WebUI の導入 Phi-4-mini-flash-reasoning

1. チュートリアルの概要

2. プロジェクト例

3. 操作手順

4. 議論

引用情報

関連 ノートブック

vLLM+Open WebUIを使用してGLM-4.7-Flashを展開する

Fara-7B: 非常に効率的なWebベースのインテリジェントエージェントモデル

vLLM+Open WebUI を使用した QwenLong-L1.5 のデプロイ

vLLM+Open WebUIを使用してIQuest-Coder-V1をデプロイする

vLLM+Open WebUI 導入機能Gemma-270m-it

vLLM+Open WebUI が Nemotron-3 Nano を導入

vLLM+Open WebUIを使用したLFM2.5-1.2B-Thinkingの導入

F5-E2 TTS あらゆるサウンドをわずか 3 秒でクローン作成

vLLM+OpenWebUIを使用したVibeThinker-1.5Bのデプロイ

AIでAIを構築

HyperAI Newsletters

関連 ノートブック

vLLM+Open WebUIを使用してGLM-4.7-Flashを展開する

Fara-7B: 非常に効率的なWebベースのインテリジェントエージェントモデル

vLLM+Open WebUI を使用した QwenLong-L1.5 のデプロイ

vLLM+Open WebUIを使用してIQuest-Coder-V1をデプロイする

vLLM+Open WebUI 導入機能Gemma-270m-it

vLLM+Open WebUI が Nemotron-3 Nano を導入

vLLM+Open WebUIを使用したLFM2.5-1.2B-Thinkingの導入

F5-E2 TTS あらゆるサウンドをわずか 3 秒でクローン作成

vLLM+OpenWebUIを使用したVibeThinker-1.5Bのデプロイ

関連 ノートブック

vLLM+Open WebUIを使用してGLM-4.7-Flashを展開する

Fara-7B: 非常に効率的なWebベースのインテリジェントエージェントモデル

vLLM+Open WebUI を使用した QwenLong-L1.5 のデプロイ

vLLM+Open WebUIを使用してIQuest-Coder-V1をデプロイする

vLLM+Open WebUI 導入機能Gemma-270m-it

vLLM+Open WebUI が Nemotron-3 Nano を導入

vLLM+Open WebUIを使用したLFM2.5-1.2B-Thinkingの導入

F5-E2 TTS あらゆるサウンドをわずか 3 秒でクローン作成

vLLM+OpenWebUIを使用したVibeThinker-1.5Bのデプロイ

関連ノートブック

関連ノートブック

関連ノートブック

関連ノートブック