Command Palette

Search for a command to run...

特注の Stratos 17k 推論タスク データセット

日付

9ヶ月前

サイズ

107.46 MB

組織

※本データセットはオンライン利用に対応しておりますが、ここをクリックしてジャンプしてください

Bespoke-Stratos-17kは、2025年にBespoke Labsチームによって開発された、推論タスク用に設計された高品質のデータセットです。関連するブログは「ビスポーク・ストラトス:推論蒸留の不合理な有効性「」。このデータセットは、バークレーの Sky-T1 データ パイプラインを改良し、DeepSeek-R1 から抽出されたデータを使用することで生成され、高性能推論モデルのトレーニングをサポートするように設計されています。このデータセットには、コード、数学、科学的なパズルなど、さまざまな分野を網羅した質問、推論の痕跡、回答が含まれています。 Bespoke Curator ツールを使用すると、わずか 1.5 時間で、約 800 ドルのコストで高品質の推論データセットを生成できます。このデータセットでは、教師推論モデルとして DeepSeek-R1 を使用しているため、追加のフォーマット手順を必要とせずにデータ生成プロセスが簡素化されます。さらに、gpt-4o-mini を通じて誤った数学的解答を除外することで、正しい数学的解答の保持率が 25% から 73% に大幅に向上しました。

データセットは、プログラミング データ (APP と TACO からの 5,000 のデータ)、数学データ (NuminaMATH データセットの AIME、MATH、および Olympiads サブセットからの 10,000 のデータ)、科学およびパズル データ (STILL-2 からの 1,000 のデータ) の 3 つの部分で構成されています。このデータは、Bespoke-Stratos-32B と Bespoke-Stratos-7B という 2 つの推論モデルのトレーニングに使用され、数学およびコード推論ベンチマークで優れたパフォーマンスを発揮し、以前のモデルを上回りました。

Bespoke-Stratos-17k.torrent
シーディング 1ダウンロード中 0ダウンロード完了 133総ダウンロード数 237
  • Bespoke-Stratos-17k/
    • README.md
      2.05 KB
    • README.txt
      4.09 KB
      • data/
        • Bespoke-Stratos-17k.zip
          107.46 MB

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング
すぐに使える GPU
最適価格
今すぐ始める

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
特注の Stratos 17k 推論タスク データセット | データセット | HyperAI超神経