HyperAI초신경

Vcgbench Diverse

VCGBench-Diverse는 비디오 대형 언어 모델의 일반화 능력을 종합적으로 평가하기 위해 설계된 벤치마크입니다. 이 벤치마크는 877개의 비디오 클립, 18개의 광범위한 카테고리, 그리고 4,354개의 질문-답변 쌍을 포함하여 강력한 평가 체계를 제공합니다. 평가는 정보 정확성, 세부 사항 이해, 맥락 이해, 시간적 이해, 일관성 등 다섯 가지 측면을 포함하며, 밀도 높은 비디오 캡셔닝, 공간 이해, 추론 등 세 가지 중요한 영역에서 성능 분석을 제공합니다.