비디오 기반 생성 성능 벤치마킹 (맥락 이해)

"비디오 기반 생성적 성능 벤치마킹 (맥락 이해)"은 생성 비디오 대화 모델의 맥락 이해 능력을 평가하기 위해 설계된 벤치마킹 작업입니다. 이 작업은 ActivityNet-200 데이터셋을 기반으로 하며, 풍부한 밀도 높은 설명 캡션과 사람에 의해 주석이 달린 질문-답변 쌍을 포함하는 테스트 세트를 구성합니다. GPT-3.5 모델을 사용하여 생성된 예측을 점수화하여, 비디오 내용에 대한 모델의 이해도와 생성 능력을 종합적으로 측정하고자 합니다. 이를 통해 비디오 대화 시스템의 성능 최적화와 응용 프로그램 개발을 촉진합니다."

비디오 기반 생성 성능 벤치마킹 (맥락 이해) | SOTA | HyperAI초신경