HyperAI
Command Palette
Search for a command to run...
Open-RL 추론 문제 데이터셋
Open-RL은 Turing에서 2026년에 공개한 다중 영역 추론 문제 데이터셋으로, 물리학, 수학, 생물학, 화학 분야의 독립적이고 검증 가능하며 명확한 STEM 추론 문제를 포함합니다. 각 문제는 다단계 추론을 요구하며, 기호 연산 및/또는 수치 계산을 포함하고, 객관적으로 검증 가능한 최종 답을 가지고 있습니다. 이 데이터셋은 강화 학습 미세 조정, 보상 모델링, 결과 중심 학습, 검증 가능한 추론 벤치마킹에 적합합니다. 데이터 필드:
- conversation_id: 각 질문-답변 쌍에 대한 고유 식별자
- 영역: 연구 분야 (물리학, 수학, 화학, 생물학)
- 하위 도메인: 특정 주제
- 질문: LaTeX에 대한 STEM 지원 - 문제 설명
- 답변: 명확하고 표준적인 답변입니다.
이 데이터셋은 커뮤니티 사용자가 기여한 것이며 교육 및 정보 제공 목적으로만 사용됩니다. 저작권 침해와 관련된 콘텐츠가 있는 경우 [email protected]로 문의하시면 신속하게 검토 및 삭제 처리하겠습니다.