HyperAI超神経

DeepSeek-R1-0528-Qwen3-8Bのワンクリック展開

1. チュートリアルの概要

このチュートリアルで使用されるコンピューティング リソースは、単一の RTX 4090 カードです。

DeepSeek-R1-0528-Qwen3-8Bは、DeepSeekチームによって2025年5月にリリースされました。これは、DeepSeek-R1-0528の思考連鎖蒸留技術に基づいてトレーニングされた軽量推論モデルです。このモデルには 80 億のパラメータがあります。 DeepSeek-R1-0528 の複雑な推論機能をより小型の Qwen3-8B ベース モデルに統合することで、Qwen3 の多言語機能と DeepSeek-R1 の推論最適化が組み合わされています。そのパフォーマンスは GPT-4 に匹敵し、効率的なシングルカード展開をサポートしているため、学術およびエンタープライズ アプリケーションに最適です。 AIME 2024では、DeepSeek-R1-0528-Qwen3-8Bがオープンソースモデルの中で最高のパフォーマンス(SOTA)を達成し、Qwen3 8B +10.0%を上回り、Qwen3-235B-thinkingのパフォーマンスに匹敵しました。

2. プロジェクト例

3. 操作手順

1. コンテナを起動します

「モデル」が表示されていない場合は、モデルが初期化中であることを意味します。モデルが大きいため、2〜3分ほど待ってページを更新してください。

2. Web ページに入ると、モデルと会話を開始できます。

4. 議論

🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。

引用情報

このプロジェクトの引用情報は次のとおりです。

@misc{deepseekai2025deepseekr1incentivizingreasoningcapability,
      title={DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning}, 
      author={DeepSeek-AI},
      year={2025},
      eprint={2501.12948},
      archivePrefix={arXiv},
      primaryClass={cs.CL},
      url={https://arxiv.org/abs/2501.12948}, 
}