HyperAI超神経
ホーム
ニュース
最新論文
チュートリアル
データセット
学会
百科事典
SOTA
LLMモデル
検索
サイトについて
日本語
HyperAI超神経
Toggle sidebar
サイトを検索…
⌘
K
ホーム
SOTA
Mathematical Reasoning
Mathematical Reasoning
ベンチマークリスト
このタスクに関連するすべてのベンチマーク
aime24
最高モデル: DeepSeek-r1
評価指標
詳細を表示
lila-ood
最高モデル: Codex (Few-Shot, 175B)
評価指標
詳細を表示
math500
最高モデル: Search-o1
評価指標
詳細を表示
unigeo
最高モデル: GOLD
評価指標
詳細を表示
amc23
評価指標
詳細を表示
frontiermath
評価指標
詳細を表示
geoqa
評価指標
詳細を表示
lila-iid
評価指標
詳細を表示
mmlu-mathematics
評価指標
詳細を表示
pgps9k
評価指標
詳細を表示
unigeo-prv
評価指標
詳細を表示