HyperAI

Auto Debugging On Big Bench Lite

Métriques

Exact string match

Résultats

Résultats de performance de divers modèles sur ce benchmark

Tableau comparatif
Nom du modèleExact string match
palm-scaling-language-modeling-with-pathways-138.2
palm-scaling-language-modeling-with-pathways-114.7
palm-scaling-language-modeling-with-pathways-138.2