HyperAI超神経

OpenThoughts-114k推論データセット

日付

3ヶ月前

サイズ

922.07 MB

組織

公開URL

github.com

ライセンス

Apache 2.0

※本データセットはオンライン利用に対応しておりますが、ここをクリックしてジャンプしてください

OpenThoughts-114k は、数学、コーディング、科学、パズルなどの分野に焦点を当てたオープンソースの推論データセットで、114,000 個の高品質サンプルが含まれています。 2025 年に Open Thoughts によってリリースされたこのデータセットは、数学およびコード推論タスクにおいて既存の大規模モデル (DeepSeek-R1-Distill-Qwen-32B や DeepSeek-R1-Distill-Qwen-7B など) を上回るパフォーマンスを発揮するように小規模な推論モデルをトレーニングすることを目的としています。

データセット生成プロセス
OpenThoughts-114k.torrent
シーディング 1ダウンロード中 1ダウンロード完了 69総ダウンロード数 133
  • OpenThoughts-114k/
    • README.md
      1.12 KB
    • README.txt
      2.25 KB
      • data/
        • OpenThoughts-114k.zip
          922.07 MB