HyperAIHyperAI

Command Palette

Search for a command to run...

Open-RL 추론 문제 데이터셋

날짜

2달 전

라이선스

MIT

Open-RL은 Turing에서 2026년에 공개한 다중 영역 추론 문제 데이터셋으로, 물리학, 수학, 생물학, 화학 분야의 독립적이고 검증 가능하며 명확한 STEM 추론 문제를 포함합니다. 각 문제는 다단계 추론을 요구하며, 기호 연산 및/또는 수치 계산을 포함하고, 객관적으로 검증 가능한 최종 답을 가지고 있습니다. 이 데이터셋은 강화 학습 미세 조정, 보상 모델링, 결과 중심 학습, 검증 가능한 추론 벤치마킹에 적합합니다. 데이터 필드:

  • conversation_id: 각 질문-답변 쌍에 대한 고유 식별자
  • 영역: 연구 분야 (물리학, 수학, 화학, 생물학)
  • 하위 도메인: 특정 주제
  • 질문: LaTeX에 대한 STEM 지원 - 문제 설명
  • 답변: 명확하고 표준적인 답변입니다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
Open-RL 추론 문제 데이터셋 | 데이터 세트 | HyperAI초신경