HyperAI超神経

Crass Ai On Big Bench

評価指標

Accuracy

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名Accuracy
orca-2-teaching-small-language-models-how-to86.86
scaling-language-models-methods-analysis-156.8
orca-2-teaching-small-language-models-how-to84.31
training-compute-optimal-large-language75.0