HyperAI

Auto Debugging On Big Bench Lite

Metriken

Exact string match

Ergebnisse

Leistungsergebnisse verschiedener Modelle zu diesem Benchmark

Vergleichstabelle
ModellnameExact string match
palm-scaling-language-modeling-with-pathways-138.2
palm-scaling-language-modeling-with-pathways-114.7
palm-scaling-language-modeling-with-pathways-138.2