HyperAIHyperAI

Command Palette

Search for a command to run...

PromptCoT-2.0-SFT-4.8M 教師あり微調整プロンプトSFTデータセット

日付

4ヶ月前

サイズ

21.79 GB

データセット構成

香港大学
アリグループ

Paper URL

2509.19894

ライセンス

MIT

PromptCoT-2.0-SFT-4.8Mは、香港大学とAnt Groupの研究チームが2025年に公開した大規模な合成プロンプトデータセットです。関連する論文結果は「PromptCoT 2.0: 大規模言語モデル推論のためのプロンプト合成のスケーリング」は、大規模言語モデルの微調整や自己トレーニングに使用できる高品質な推論プロンプト コーパスを提供することを目的としています。

このデータセットには、教師ありの微調整と自己練習の両方のシナリオでの推論軌跡を含む約 480 万の完全に合成されたプロンプトが含まれており、数学とプログラミングという 2 つの主要な推論領域をカバーしています。

データ構成:

  • 教師あり微調整 (SFT) シナリオでは、次のものを含め、合計 4,766,890 件のプロンプトが合成されました。
    • 1,188,505 個のプログラミングタスクプロンプト
    • 3,578,385 個の数学課題プロンプト

PromptCoT-2.0-SFT-4.8M.torrent
シーディング 1ダウンロード中 0完了 34総ダウンロード数 99
  • PromptCoT-2.0-SFT-4.8M/
    • README.md
      1.53 KB
    • README.txt
      3.06 KB
      • data/
        • PromptCoT-2.0-SFT-4.8M.zip
          21.79 GB

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています