HyperAI超神経
ホーム
ニュース
最新論文
チュートリアル
データセット
学会
百科事典
SOTA
LLMモデル
検索
サイトについて
日本語
HyperAI超神経
Toggle sidebar
サイトを検索…
⌘
K
ホーム
SOTA
Multi Task Language Understanding
Multi Task Language Understanding
ベンチマークリスト
このタスクに関連するすべてのベンチマーク
bbh-alg
最高モデル: code-davinci-002 175B (CoT)
評価指標
詳細を表示
bbh-nlp
最高モデル: Flan-PaLM 540B (3-shot, fine-tuned, CoT + SC)
評価指標
詳細を表示
mgsm
評価指標
詳細を表示
mmlu
最高モデル: ds-r1(671b)
評価指標
詳細を表示
mmlu-5-shot
最高モデル: Sakalti/ultiima-78B
評価指標
詳細を表示