HyperAIHyperAI

Command Palette

Search for a command to run...

Open-RL推論問題データセット

日付

5時間前

ライセンス

MIT

Open-RLは、チューリングが2026年に公開したマルチドメイン推論問題データセットです。物理学、数学、生物学、化学における独立性、検証可能性、明示的なSTEM推論問題が含まれています。各問題は複数段階の推論を必要とし、記号演算や数値計算を伴い、客観的に検証可能な最終解を持ちます。このデータセットは、強化学習のファインチューニング、報酬モデリング、結果教師あり学習、検証可能な推論ベンチマークに適しています。

データフィールド:

  • conversation_id: 各質問と回答のペアの一意の識別子
  • ドメイン: 研究分野(物理学、数学、化学、生物学)
  • sub_domain: 特定の主題
  • 質問: LaTeX の STEM サポート - 問題の説明
  • 回答: 決定的で標準的な答え

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています