HyperAI
Command Palette
Search for a command to run...
Big-Math 강화 학습 수학 데이터 세트
Big-Math는 언어 모델에서 강화 학습(RL)을 적용하도록 설계된 대규모 고품질 수학 데이터 세트입니다. 이 데이터 세트는 스탠포드 대학과 SynthLabs의 연구자들에 의해 2025년에 공개되었습니다.Big-Math: 언어 모델의 강화 학습을 위한 대규모 고품질 수학 데이터 세트".
데이터 세트 특성
Big-Math에는 25만 개 이상의 고품질 수학 문제가 포함되어 있으며, 각 문제에는 검증 가능한 답이 있습니다. 데이터 세트의 질문은 3가지 핵심 기준을 충족합니다.
- 유일하게 검증 가능한 솔루션: 각 질문에는 정답이 단 하나뿐입니다.
- 폐쇄형 솔루션: 질문에는 명확한 해결책이 있습니다. 각 질문에는 검증 가능한 답변이 제공됩니다.
- 개방형 질문: 문제 설명이 개방적이어서 여러 가지 해결책이 가능합니다.

Llama-3.1-8B를 사용하여 계산된 도메인별 솔루션 속도 분포
Big-Math-RL-Verified.torrent
시딩 1다운로드 중 0완료됨 187총 다운로드 수 387
이 데이터셋은 커뮤니티 사용자가 기여한 것이며 교육 및 정보 제공 목적으로만 사용됩니다. 저작권 침해와 관련된 콘텐츠가 있는 경우 [email protected]로 문의하시면 신속하게 검토 및 삭제 처리하겠습니다.