HyperAI
Command Palette
Search for a command to run...
Open-RL推論問題データセット
Open-RLは、チューリングが2026年に公開したマルチドメイン推論問題データセットです。物理学、数学、生物学、化学における独立性、検証可能性、明示的なSTEM推論問題が含まれています。各問題は複数段階の推論を必要とし、記号演算や数値計算を伴い、客観的に検証可能な最終解を持ちます。このデータセットは、強化学習のファインチューニング、報酬モデリング、結果教師あり学習、検証可能な推論ベンチマークに適しています。
データフィールド:
- conversation_id: 各質問と回答のペアの一意の識別子
- ドメイン: 研究分野(物理学、数学、化学、生物学)
- sub_domain: 特定の主題
- 質問: LaTeX の STEM サポート - 問題の説明
- 回答: 決定的で標準的な答え
このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。