Spatial Reasoning On Embspatial Bench
평가 지표
Generation
평가 결과
이 벤치마크에서 각 모델의 성능 결과
비교 표
모델 이름 | Generation |
---|---|
gpt-4-technical-report-1 | 36.07 |
qwen-vl-a-frontier-large-vision-language | 49.11 |
visual-instruction-tuning-1 | 35.19 |
minigpt-4-enhancing-vision-language | 23.54 |
sofar-language-grounded-orientation-bridges | 70.88 |