HyperAI超神经

※本データセットはオンライン利用に対応しておりますが、ここをクリックしてジャンプしてください。

Bespoke-Stratos-17kは、2025年にBespoke Labsチームによって開発された、推論タスク用に設計された高品質のデータセットです。関連するブログは「ビスポーク・ストラトス：推論蒸留の不合理な有効性「」。このデータセットは、バークレーの Sky-T1 データパイプラインを改良し、DeepSeek-R1 から抽出されたデータを使用することで生成され、高性能推論モデルのトレーニングをサポートするように設計されています。このデータセットには、コード、数学、科学的なパズルなど、さまざまな分野を網羅した質問、推論の痕跡、回答が含まれています。 Bespoke Curator ツールを使用すると、わずか 1.5 時間で、約 800 ドルのコストで高品質の推論データセットを生成できます。このデータセットでは、教師推論モデルとして DeepSeek-R1 を使用しているため、追加のフォーマット手順を必要とせずにデータ生成プロセスが簡素化されます。さらに、gpt-4o-mini を通じて誤った数学的解答を除外することで、正しい数学的解答の保持率が 25% から 73% に大幅に向上しました。

データセットは、プログラミングデータ (APP と TACO からの 5,000 のデータ)、数学データ (NuminaMATH データセットの AIME、MATH、および Olympiads サブセットからの 10,000 のデータ)、科学およびパズルデータ (STILL-2 からの 1,000 のデータ) の 3 つの部分で構成されています。このデータは、Bespoke-Stratos-32B と Bespoke-Stratos-7B という 2 つの推論モデルのトレーニングに使用され、数学およびコード推論ベンチマークで優れたパフォーマンスを発揮し、以前のモデルを上回りました。

特注の Stratos 17k 推論タスク データセット

※本データセットはオンライン利用に対応しておりますが、ここをクリックしてジャンプしてください。

特注の Stratos 17k 推論タスクデータセット