Zero Shot Video Question Answer On Video Mme
評価指標
Accuracy (%)
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
比較表
モデル名 | Accuracy (%) |
---|---|
gemini-1-5-unlocking-multimodal-understanding | 66.3 |
gpt-4o-visual-perception-performance-of | 62.3 |
videollama-2-advancing-spatial-temporal | 60.9 |
vila-on-pre-training-for-visual-language | 61.4 |
video-rag-visually-aligned-retrieval | 77.4 |
モデル 6 | 64.8 |
gemini-1-5-unlocking-multimodal-understanding | 71.9 |
gpt-4o-visual-perception-performance-of | 70.3 |