HyperAI超神経

Auto Debugging On Big Bench Lite

評価指標

Exact string match

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名Exact string match
palm-scaling-language-modeling-with-pathways-138.2
palm-scaling-language-modeling-with-pathways-114.7
palm-scaling-language-modeling-with-pathways-138.2