HyperAI

Multimodal Reasoning On Rebus

Métriques

Accuracy

Résultats

Résultats de performance de divers modèles sur ce benchmark

Tableau comparatif
Nom du modèleAccuracy
rebus-a-robust-evaluation-benchmark-of-10.6
rebus-a-robust-evaluation-benchmark-of-10.9
rebus-a-robust-evaluation-benchmark-of-10.9
rebus-a-robust-evaluation-benchmark-of-11.8
rebus-a-robust-evaluation-benchmark-of-113.2
rebus-a-robust-evaluation-benchmark-of-11.5
rebus-a-robust-evaluation-benchmark-of-10.9
rebus-a-robust-evaluation-benchmark-of-124.0