Spatial Reasoning On Embspatial Bench
Métriques
Generation
Résultats
Résultats de performance de divers modèles sur ce benchmark
Tableau comparatif
Nom du modèle | Generation |
---|---|
gpt-4-technical-report-1 | 36.07 |
qwen-vl-a-frontier-large-vision-language | 49.11 |
visual-instruction-tuning-1 | 35.19 |
minigpt-4-enhancing-vision-language | 23.54 |
sofar-language-grounded-orientation-bridges | 70.88 |