HyperAI

このデータセットを使用 Discordで議論

日付

9ヶ月前

データセット構成

Paper URL

arxiv.org

タグ

数学

このデータセットは、スタンフォード大学とワシントン大学の研究チームによって 2025 年に公開された数学の問題推論データセットです。大規模言語モデル (LLM) の導出の論理的一貫性を高め、数学的推論を通じて構造化された思考を最適化することを目的としています。関連する論文の結果は次のとおりです。s1: 単純なテスト時間のスケーリング”。

このデータセットには、代数、幾何学、確率など複数の数学分野を網羅する数学の問題と推論軌跡に焦点を当てた1,000件のサンプルが含まれています。各サンプルには、問題の説明、解答手順、解答、そしてDeepSeek r1によって生成された推論軌跡が含まれています。

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

このデータセットを使用 Discordで議論

日付

9ヶ月前

データセット構成

Paper URL

arxiv.org

タグ

数学

Nemotron-Math-v2 数学推論データセット

24日前

LongBench-Pro ロングコンテキスト包括的評価データセット

1ヶ月前

RoVid-X ロボットビデオ生成データセット

4日前

カメラクローンマルチビューデータセット

2ヶ月前

INFINITY-CHAT リアルオープン質問応答データセット

2ヶ月前

NAMD_Benchmark 分子動力学パフォーマンスベンチマークデータセット

3ヶ月前

MUVR マルチモーダル非クロップ動画検索ベンチマーク

2ヶ月前

VERA音声推論評価データセット

3ヶ月前

2.37 GB59

Med-Banana-50K 医療画像編集データセット

1ヶ月前

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

Command Palette

s1K-1.1 数学的推論データセット

AIでAIを構築

HyperAI Newsletters

Command Palette

s1K-1.1 数学的推論データセット

関連 データセット

Nemotron-Math-v2 数学推論データセット

LongBench-Pro ロングコンテキスト包括的評価データセット

RoVid-X ロボット ビデオ生成データセット

カメラクローンマルチビューデータセット

INFINITY-CHAT リアルオープン質問応答データセット

NAMD_Benchmark 分子動力学パフォーマンスベンチマークデータセット

MUVR マルチモーダル非クロップ動画検索ベンチマーク

VERA音声推論評価データセット

Med-Banana-50K 医療画像編集データセット

AIでAIを構築

HyperAI Newsletters

Command Palette

s1K-1.1 数学的推論データセット

関連 データセット

Nemotron-Math-v2 数学推論データセット

LongBench-Pro ロングコンテキスト包括的評価データセット

RoVid-X ロボット ビデオ生成データセット

カメラクローンマルチビューデータセット

INFINITY-CHAT リアルオープン質問応答データセット

NAMD_Benchmark 分子動力学パフォーマンスベンチマークデータセット

MUVR マルチモーダル非クロップ動画検索ベンチマーク

VERA音声推論評価データセット

Med-Banana-50K 医療画像編集データセット

AIでAIを構築

HyperAI Newsletters

関連 データセット

Nemotron-Math-v2 数学推論データセット

LongBench-Pro ロングコンテキスト包括的評価データセット

RoVid-X ロボット ビデオ生成データセット

カメラクローンマルチビューデータセット

INFINITY-CHAT リアルオープン質問応答データセット

NAMD_Benchmark 分子動力学パフォーマンスベンチマークデータセット

MUVR マルチモーダル非クロップ動画検索ベンチマーク

VERA音声推論評価データセット

Med-Banana-50K 医療画像編集データセット

関連 データセット

Nemotron-Math-v2 数学推論データセット

LongBench-Pro ロングコンテキスト包括的評価データセット

RoVid-X ロボット ビデオ生成データセット

カメラクローンマルチビューデータセット

INFINITY-CHAT リアルオープン質問応答データセット

NAMD_Benchmark 分子動力学パフォーマンスベンチマークデータセット

MUVR マルチモーダル非クロップ動画検索ベンチマーク

VERA音声推論評価データセット

Med-Banana-50K 医療画像編集データセット

関連データセット

RoVid-X ロボットビデオ生成データセット

関連データセット

RoVid-X ロボットビデオ生成データセット

関連データセット

RoVid-X ロボットビデオ生成データセット

関連データセット

RoVid-X ロボットビデオ生成データセット