HyperAI초신경

Auto Debugging On Big Bench Lite

평가 지표

Exact string match

평가 결과

이 벤치마크에서 각 모델의 성능 결과

비교 표
모델 이름Exact string match
palm-scaling-language-modeling-with-pathways-138.2
palm-scaling-language-modeling-with-pathways-114.7
palm-scaling-language-modeling-with-pathways-138.2