日付

6ヶ月前

サイズ

1.72 MB

タグ

vLLM

ライセンス

Apache 2.0

GitHub

QwenLM/Qwen3

論文URL

2505.09388

1. チュートリアルの概要

Qwen3-4B-Thinking-2507とQwen3-4B-Instruct-2507は、アリババのTongyi Qianwenチームが2025年8月に発表した大規模言語モデルです。性能面では、Qwen3-4B-Thinking-2507は、複雑な問題の推論、数学的能力、コーディング能力、マルチターン関数呼び出し能力において、同規模の小規模Qwen3モデルを大幅に上回っています。非推論領域では、Qwen3-4B-Instruct-2507は、知識、推論、プログラミング、アライメント、エージェンシー能力において、クローズドソースの小規模モデルGPT-4.1-nanoを総合的に上回り、その性能は中規模のQwen3-30B-A3B（非思考）に迫るものです。このモデルは、よりロングテールな言語知識をカバーし、主観的および自由記述的なタスクにおける人間の嗜好とのアライメントを高め、より関連性の高い応答を提供できます。関連論文の結果は… Qwen3 技術レポート。

このチュートリアルでは、デュアルカード RTX 4090 リソースを使用します。

2. プロジェクト例

Qwen3-4B-思考-2507

Qwen3-4B-Instruct-2507

3. 操作手順

1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

2. Web ページに入ると、モデルと会話を開始できます。

「モデル」が表示されない場合は、モデルが初期化中です。モデルのサイズが大きいため、2～3分ほどお待ちいただき、ページを更新してください。

利用手順

Qwen3-4B-思考-2507

Qwen3-4B-Instruct-2507

4. 議論

🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。

引用情報

このプロジェクトの引用情報は次のとおりです。

@misc{qwen3technicalreport,
      title={Qwen3 Technical Report}, 
      author={Qwen Team},
      year={2025},
      eprint={2505.09388},
      archivePrefix={arXiv},
      primaryClass={cs.CL},
      url={https://arxiv.org/abs/2505.09388}, 
}

このノートブックはコミュニティユーザーによって提供されたものであり、教育および情報提供のみを目的としています。コンテンツに著作権侵害が含まれる場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

このNotebookを実行 Discordで議論

日付

6ヶ月前

サイズ

1.72 MB

タグ

vLLM

ライセンス

Apache 2.0

GitHub

QwenLM/Qwen3

論文URL

2505.09388

1. チュートリアルの概要

このチュートリアルでは、デュアルカード RTX 4090 リソースを使用します。

2. プロジェクト例

Qwen3-4B-思考-2507

Qwen3-4B-Instruct-2507

3. 操作手順

1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

2. Web ページに入ると、モデルと会話を開始できます。

「モデル」が表示されない場合は、モデルが初期化中です。モデルのサイズが大きいため、2～3分ほどお待ちいただき、ページを更新してください。

利用手順

Qwen3-4B-思考-2507

Qwen3-4B-Instruct-2507

4. 議論

引用情報

このプロジェクトの引用情報は次のとおりです。

@misc{qwen3technicalreport,
      title={Qwen3 Technical Report}, 
      author={Qwen Team},
      year={2025},
      eprint={2505.09388},
      archivePrefix={arXiv},
      primaryClass={cs.CL},
      url={https://arxiv.org/abs/2505.09388}, 
}

LongCat-Video: MeituanのオープンソースAIビデオ生成モデル

3ヶ月前

HunyuanOCR: Tencent Hunyuan エンドツーエンド OCR

2ヶ月前

LongCat-Image: バイリンガルテキスト駆動型画像生成システム

2ヶ月前

DeepSeek-R1-70Bのワンクリック展開

3ヶ月前

llama.cpp+openwebuiはQwen3-VL-8B-Instruct-GGUFを展開します。

5日前

Ministry-3-14B-Instructのワンクリック展開

2ヶ月前

MedGemma-27b-text-it医療推論モデルのワンクリック展開

3ヶ月前

SmolLM3-3Bモデルのワンクリック展開

3ヶ月前

Qwen-Image-Lightningのワンクリック展開

2ヶ月前

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

Command Palette

Qwen3-4B-2507のワンクリック展開

1. チュートリアルの概要

2. プロジェクト例

3. 操作手順

4. 議論

引用情報

AIでAIを構築

HyperAI Newsletters

Command Palette

Qwen3-4B-2507のワンクリック展開

1. チュートリアルの概要

2. プロジェクト例

3. 操作手順

4. 議論

引用情報

関連 ノートブック

LongCat-Video: MeituanのオープンソースAIビデオ生成モデル

HunyuanOCR: Tencent Hunyuan エンドツーエンド OCR

LongCat-Image: バイリンガルテキスト駆動型画像生成システム

DeepSeek-R1-70Bのワンクリック展開

llama.cpp+openwebuiはQwen3-VL-8B-Instruct-GGUFを展開します。

Ministry-3-14B-Instructのワンクリック展開

MedGemma-27b-text-it医療推論モデルのワンクリック展開

SmolLM3-3Bモデルのワンクリック展開

Qwen-Image-Lightningのワンクリック展開

AIでAIを構築

HyperAI Newsletters

Command Palette

Qwen3-4B-2507のワンクリック展開

1. チュートリアルの概要

2. プロジェクト例

3. 操作手順

4. 議論

引用情報

関連 ノートブック

LongCat-Video: MeituanのオープンソースAIビデオ生成モデル

HunyuanOCR: Tencent Hunyuan エンドツーエンド OCR

LongCat-Image: バイリンガルテキスト駆動型画像生成システム

DeepSeek-R1-70Bのワンクリック展開

llama.cpp+openwebuiはQwen3-VL-8B-Instruct-GGUFを展開します。

Ministry-3-14B-Instructのワンクリック展開

MedGemma-27b-text-it医療推論モデルのワンクリック展開

SmolLM3-3Bモデルのワンクリック展開

Qwen-Image-Lightningのワンクリック展開

AIでAIを構築

HyperAI Newsletters

関連 ノートブック

LongCat-Video: MeituanのオープンソースAIビデオ生成モデル

HunyuanOCR: Tencent Hunyuan エンドツーエンド OCR

LongCat-Image: バイリンガルテキスト駆動型画像生成システム

DeepSeek-R1-70Bのワンクリック展開

llama.cpp+openwebuiはQwen3-VL-8B-Instruct-GGUFを展開します。

Ministry-3-14B-Instructのワンクリック展開

MedGemma-27b-text-it医療推論モデルのワンクリック展開

SmolLM3-3Bモデルのワンクリック展開

Qwen-Image-Lightningのワンクリック展開

関連 ノートブック

LongCat-Video: MeituanのオープンソースAIビデオ生成モデル

HunyuanOCR: Tencent Hunyuan エンドツーエンド OCR

LongCat-Image: バイリンガルテキスト駆動型画像生成システム

DeepSeek-R1-70Bのワンクリック展開

llama.cpp+openwebuiはQwen3-VL-8B-Instruct-GGUFを展開します。

Ministry-3-14B-Instructのワンクリック展開

MedGemma-27b-text-it医療推論モデルのワンクリック展開

SmolLM3-3Bモデルのワンクリック展開

Qwen-Image-Lightningのワンクリック展開

関連ノートブック

関連ノートブック

関連ノートブック

関連ノートブック