Spatial Reasoning On Embspatial Bench
Metriken
Generation
Ergebnisse
Leistungsergebnisse verschiedener Modelle zu diesem Benchmark
Vergleichstabelle
Modellname | Generation |
---|---|
gpt-4-technical-report-1 | 36.07 |
qwen-vl-a-frontier-large-vision-language | 49.11 |
visual-instruction-tuning-1 | 35.19 |
minigpt-4-enhancing-vision-language | 23.54 |
sofar-language-grounded-orientation-bridges | 70.88 |