HyperAI

Gsm8K On Gsm8K

Métriques

0-shot MRR

Résultats

Résultats de performance de divers modèles sur ce benchmark

Tableau comparatif
Nom du modèle0-shot MRR
mygo-multiplex-cot-a-method-for-self98
toward-self-improvement-of-llms-via-