HyperAI초신경

Big-Math 강화 학습 수학 데이터 세트

날짜

2달 전

크기

27.41 MB

발행 주소

github.com

* 이 데이터 세트는 온라인 사용을 지원합니다.여기를 클릭하여 이동하세요.

Big-Math는 언어 모델에서 강화 학습(RL)을 적용하도록 설계된 대규모 고품질 수학 데이터 세트입니다. 이 데이터 세트는 스탠포드 대학과 SynthLabs의 연구자들에 의해 2025년에 공개되었습니다.Big-Math: 언어 모델의 강화 학습을 위한 대규모 고품질 수학 데이터 세트".

데이터 세트 특성

Big-Math에는 25만 개 이상의 고품질 수학 문제가 포함되어 있으며, 각 문제에는 검증 가능한 답이 있습니다. 데이터 세트의 질문은 3가지 핵심 기준을 충족합니다.

  • 유일하게 검증 가능한 솔루션: 각 질문에는 정답이 단 하나뿐입니다.
  • 폐쇄형 솔루션: 질문에는 명확한 해결책이 있습니다. 각 질문에는 검증 가능한 답변이 제공됩니다.
  • 개방형 질문: 문제 설명이 개방적이어서 여러 가지 해결책이 가능합니다.
Llama-3.1-8B를 사용하여 계산된 도메인별 솔루션 속도 분포
Big-Math-RL-Verified.torrent
시딩 1다운로드 중 1완료됨 22총 다운로드 횟수 48
  • Big-Math-RL-Verified/
    • README.md
      1.58 KB
    • README.txt
      3.17 KB
      • data/
        • bigmath.zip
          27.41 MB