HyperAI超神経

Big-Math 強化学習数学データセット

日付

2ヶ月前

サイズ

27.41 MB

公開URL

github.com

※本データセットはオンライン利用に対応しておりますが、ここをクリックしてジャンプしてください

Big-Math は、言語モデルにおける強化学習 (RL) のアプリケーション向けに設計された大規模で高品質な数学データセットです。このデータセットは、スタンフォード大学とSynthLabsの研究者によって2025年に公開されました。Big-Math: 言語モデルの強化学習のための大規模で高品質な数学データセット”。

データセットの特性

Big-Math には 25 万を超える高品質の数学の問題が含まれており、それぞれに検証可能な解答が付いています。データセット内の質問は、次の 3 つの主要な基準を満たしています。

  • 検証可能な唯一の解決策: 各質問には正解が 1 つだけあります。
  • 閉じた形式の解: 質問には明確な解決策があります。各質問には検証可能な回答が付いています。
  • 自由回答形式の質問: 問題の定義はオープンであり、複数の解決策が可能です。
Llama-3.1-8Bを使用して計算されたドメインごとの解決率の分布
Big-Math-RL-Verified.torrent
シーディング 1ダウンロード中 1ダウンロード完了 22総ダウンロード数 48
  • Big-Math-RL-Verified/
    • README.md
      1.58 KB
    • README.txt
      3.17 KB
      • data/
        • bigmath.zip
          27.41 MB