HyperAI超神経

ワンクリック展開 | DeepSeek-R1の新バージョンは、小さなアップグレードでオープンソースの王座に就き、多くの評価がQwen3を上回った

特色图像

最近、DeepSeekは、R1モデルの「マイナー」バージョンアップグレードを実施し、DeepSeek-R1-0528をリリースしたことを正式に発表しました。このアップデートでは、DeepSeek R1 はコンピューティング リソースの割り当てを改善し、トレーニング後の段階でアルゴリズムの最適化メカニズムを導入することで、推論機能を大幅に向上させました。このモデルは、数学、プログラミング、一般的なロジックなどの複数のベンチマークで優れたパフォーマンスを発揮し、あらゆる面で Qwen3-235B と DeepSeek-R1 を上回りました。オープンソースの王座の頂点への「小さな一歩」と言えるだろう。

DeepSeek-R1-0528 の複数のベンチマークにおける主流モデルとの性能比較

さらに注目すべきは、チームが Qwen3-8B-Base のトレーニング後のために DeepSeek-R1-0528 の思考連鎖も抽出したことです。DeepSeek-R1-0528-Qwen3-8B を入手しました。このモデルは、AIME 2024 テストにおいてオープンソース モデルの中で最新の SOTA (最先端) パフォーマンスを達成し、Qwen3-8B より 10.0% 向上し、Qwen3-235B-thinking に匹敵するパフォーマンスを達成しました。

DeepSeek-R1-0528-Qwen3-8Bと主流モデルとの各種ベンチマークにおけるパフォーマンス比較

現在、HyperAI公式サイトの「チュートリアル」セクションにて、「DeepSeek-R1-0528-Qwen3-8Bのワンクリックデプロイメント」が公開されています。ぜひ体験してみてください!

チュートリアルのアドレス:https://go.hyper.ai/uRzwv

デモの実行

1. hyper.ai ホームページにアクセス後、「チュートリアル」ページを選択し、「DeepSeek-R1-0528-Qwen3-8B のワンクリック展開」を選択して、「このチュートリアルをオンラインで実行」をクリックします。

2. ページがジャンプしたら、右上隅の「クローン」をクリックしてチュートリアルを独自のコンテナにクローンします。

3. 「NVIDIA RTX 4090」と「vllm」イメージを選択します。 OpenBayes プラットフォームは新しい課金方法を導入しました。ニーズに応じて、「従量制」または「日次/週次/月次パッケージ」を選択できます。 「続行」をクリックします。新規ユーザーは、以下の招待リンクを使用して登録すると、4 時間の RTX 4090 + 5 時間の CPU フリー時間を獲得できます。

HyperAI ハイパーニューラルの専用招待リンク (ブラウザに直接コピーして開きます):

https://openbayes.com/console/signup?r=Ada0322_NR0n

4. リソースが割り当てられるまで待ちます。最初のクローン作成プロセスには約 2 分かかります。ステータスが「実行中」に変わったら、「API アドレス」の横にあるジャンプ矢印をクリックして WebUI ページに移動します。なお、APIアドレスアクセス機能をご利用いただくには、実名認証を完了していただく必要があります。

効果実証

端午節が近づき、毎年恒例の「甘塩合戦」の時期がやってまいりました。 DeepSeek-R1-0528-Qwen3-8B に質問して、どのように答えるか見てみましょう⬇️

DeepSeek-R1-0528-Qwen3-8B は完全な思考プロセスを示し、複数の角度から客観的な分析を提供することがわかります。

上記はHyperAIが推奨するチュートリアルです。ご興味がありましたらぜひ体験してみてください!チュートリアルのアドレス:https://go.hyper.ai/uRzwv