Big-Math 강화 학습 수학 데이터 세트
* 이 데이터 세트는 온라인 사용을 지원합니다.여기를 클릭하여 이동하세요.
Big-Math는 언어 모델에서 강화 학습(RL)을 적용하도록 설계된 대규모 고품질 수학 데이터 세트입니다. 이 데이터 세트는 스탠포드 대학과 SynthLabs의 연구자들에 의해 2025년에 공개되었습니다.Big-Math: 언어 모델의 강화 학습을 위한 대규모 고품질 수학 데이터 세트".
데이터 세트 특성
Big-Math에는 25만 개 이상의 고품질 수학 문제가 포함되어 있으며, 각 문제에는 검증 가능한 답이 있습니다. 데이터 세트의 질문은 3가지 핵심 기준을 충족합니다.
- 유일하게 검증 가능한 솔루션: 각 질문에는 정답이 단 하나뿐입니다.
- 폐쇄형 솔루션: 질문에는 명확한 해결책이 있습니다. 각 질문에는 검증 가능한 답변이 제공됩니다.
- 개방형 질문: 문제 설명이 개방적이어서 여러 가지 해결책이 가능합니다.

Big-Math-RL-Verified.torrent
시딩 1다운로드 중 1완료됨 22총 다운로드 횟수 48