DeepSeek-R1-0528-Qwen3-8Bのワンクリック展開
1. チュートリアルの概要
このチュートリアルで使用されるコンピューティング リソースは、単一の RTX 4090 カードです。
DeepSeek-R1-0528-Qwen3-8Bは、DeepSeekチームによって2025年5月にリリースされました。これは、DeepSeek-R1-0528の思考連鎖蒸留技術に基づいてトレーニングされた軽量推論モデルです。このモデルには 80 億のパラメータがあります。 DeepSeek-R1-0528 の複雑な推論機能をより小型の Qwen3-8B ベース モデルに統合することで、Qwen3 の多言語機能と DeepSeek-R1 の推論最適化が組み合わされています。そのパフォーマンスは GPT-4 に匹敵し、効率的なシングルカード展開をサポートしているため、学術およびエンタープライズ アプリケーションに最適です。 AIME 2024では、DeepSeek-R1-0528-Qwen3-8Bがオープンソースモデルの中で最高のパフォーマンス(SOTA)を達成し、Qwen3 8B +10.0%を上回り、Qwen3-235B-thinkingのパフォーマンスに匹敵しました。
2. プロジェクト例

3. 操作手順
1. コンテナを起動します
「モデル」が表示されていない場合は、モデルが初期化中であることを意味します。モデルが大きいため、2〜3分ほど待ってページを更新してください。

2. Web ページに入ると、モデルと会話を開始できます。

4. 議論
🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。

引用情報
このプロジェクトの引用情報は次のとおりです。
@misc{deepseekai2025deepseekr1incentivizingreasoningcapability,
title={DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning},
author={DeepSeek-AI},
year={2025},
eprint={2501.12948},
archivePrefix={arXiv},
primaryClass={cs.CL},
url={https://arxiv.org/abs/2501.12948},
}