HyperAIHyperAI

Command Palette

Search for a command to run...

Console

PromptCoT-2.0-SFT-4.8M 教師あり微調整プロンプトSFTデータセット

日付

2ヶ月前

サイズ

21.79 GB

組織

香港大学
アリグループ

論文URL

2509.19894

ライセンス

MIT

PromptCoT-2.0-SFT-4.8Mは、香港大学とAnt Groupの研究チームが2025年に公開した大規模な合成プロンプトデータセットです。関連する論文結果は「PromptCoT 2.0: 大規模言語モデル推論のためのプロンプト合成のスケーリング」は、大規模言語モデルの微調整や自己トレーニングに使用できる高品質な推論プロンプト コーパスを提供することを目的としています。

このデータセットには、教師ありの微調整と自己練習の両方のシナリオでの推論軌跡を含む約 480 万の完全に合成されたプロンプトが含まれており、数学とプログラミングという 2 つの主要な推論領域をカバーしています。

データ構成:

  • 教師あり微調整 (SFT) シナリオでは、次のものを含め、合計 4,766,890 件のプロンプトが合成されました。
    • 1,188,505 個のプログラミングタスクプロンプト
    • 3,578,385 個の数学課題プロンプト

PromptCoT-2.0-SFT-4.8M.torrent
シーディング 2ダウンロード中 0ダウンロード完了 21総ダウンロード数 76
  • PromptCoT-2.0-SFT-4.8M/
    • README.md
      1.53 KB
    • README.txt
      3.06 KB
      • data/
        • PromptCoT-2.0-SFT-4.8M.zip
          21.79 GB

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング
すぐに使える GPU
最適価格
今すぐ始める

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています