HyperAI

Multimodal Reasoning On Algopuzzlevqa

Métriques

Acc

Résultats

Résultats de performance de divers modèles sur ce benchmark

Tableau comparatif
Nom du modèleAcc
are-language-models-puzzle-prodigies30.3