HyperAIHyperAI

Command Palette

Search for a command to run...

特注の Stratos 17k 推論タスク データセット

Date

1年前

Size

107.46 MB

Organization

Bespoke-Stratos-17kは、2025年にBespoke Labsチームによって開発された、推論タスク用に設計された高品質のデータセットです。関連するブログは「ビスポーク・ストラトス:推論蒸留の不合理な有効性「」。このデータセットは、バークレーの Sky-T1 データ パイプラインを改良し、DeepSeek-R1 から抽出されたデータを使用することで生成され、高性能推論モデルのトレーニングをサポートするように設計されています。このデータセットには、コード、数学、科学的なパズルなど、さまざまな分野を網羅した質問、推論の痕跡、回答が含まれています。 Bespoke Curator ツールを使用すると、わずか 1.5 時間で、約 800 ドルのコストで高品質の推論データセットを生成できます。このデータセットでは、教師推論モデルとして DeepSeek-R1 を使用しているため、追加のフォーマット手順を必要とせずにデータ生成プロセスが簡素化されます。さらに、gpt-4o-mini を通じて誤った数学的解答を除外することで、正しい数学的解答の保持率が 25% から 73% に大幅に向上しました。

データセットは、プログラミング データ (APP と TACO からの 5,000 のデータ)、数学データ (NuminaMATH データセットの AIME、MATH、および Olympiads サブセットからの 10,000 のデータ)、科学およびパズル データ (STILL-2 からの 1,000 のデータ) の 3 つの部分で構成されています。このデータは、Bespoke-Stratos-32B と Bespoke-Stratos-7B という 2 つの推論モデルのトレーニングに使用され、数学およびコード推論ベンチマークで優れたパフォーマンスを発揮し、以前のモデルを上回りました。

Bespoke-Stratos-17k.torrent
Seeding 1Downloading 0Completed 157Total Downloads 285
  • Bespoke-Stratos-17k/
    • README.md
      2.05 KB
    • README.txt
      4.09 KB
      • data/
        • Bespoke-Stratos-17k.zip
          107.46 MB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています