特注の Stratos 17k 推論タスク データセット
※本データセットはオンライン利用に対応しておりますが、ここをクリックしてジャンプしてください。
Bespoke-Stratos-17kは、2025年にBespoke Labsチームによって開発された、推論タスク用に設計された高品質のデータセットです。関連するブログは「ビスポーク・ストラトス:推論蒸留の不合理な有効性「」。このデータセットは、バークレーの Sky-T1 データ パイプラインを改良し、DeepSeek-R1 から抽出されたデータを使用することで生成され、高性能推論モデルのトレーニングをサポートするように設計されています。このデータセットには、コード、数学、科学的なパズルなど、さまざまな分野を網羅した質問、推論の痕跡、回答が含まれています。 Bespoke Curator ツールを使用すると、わずか 1.5 時間で、約 800 ドルのコストで高品質の推論データセットを生成できます。このデータセットでは、教師推論モデルとして DeepSeek-R1 を使用しているため、追加のフォーマット手順を必要とせずにデータ生成プロセスが簡素化されます。さらに、gpt-4o-mini を通じて誤った数学的解答を除外することで、正しい数学的解答の保持率が 25% から 73% に大幅に向上しました。
データセットは、プログラミング データ (APP と TACO からの 5,000 のデータ)、数学データ (NuminaMATH データセットの AIME、MATH、および Olympiads サブセットからの 10,000 のデータ)、科学およびパズル データ (STILL-2 からの 1,000 のデータ) の 3 つの部分で構成されています。このデータは、Bespoke-Stratos-32B と Bespoke-Stratos-7B という 2 つの推論モデルのトレーニングに使用され、数学およびコード推論ベンチマークで優れたパフォーマンスを発揮し、以前のモデルを上回りました。