HyperAI超神経

Zero Shot Video Question Answer On Video Mme

評価指標

Accuracy (%)

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名Accuracy (%)
gemini-1-5-unlocking-multimodal-understanding66.3
gpt-4o-visual-perception-performance-of62.3
videollama-2-advancing-spatial-temporal60.9
vila-on-pre-training-for-visual-language61.4
video-rag-visually-aligned-retrieval77.4
モデル 664.8
gemini-1-5-unlocking-multimodal-understanding71.9
gpt-4o-visual-perception-performance-of70.3