비디오 기반 생성 성능 벤치마킹 (맥락 이해)

"비디오 기반 생성적 성능 벤치마킹 (맥락 이해)"은 생성 비디오 대화 모델의 맥락 이해 능력을 평가하기 위해 설계된 벤치마킹 작업입니다. 이 작업은 ActivityNet-200 데이터셋을 기반으로 하며, 풍부한 밀도 높은 설명 캡션과 사람에 의해 주석이 달린 질문-답변 쌍을 포함하는 테스트 세트를 구성합니다. GPT-3.5 모델을 사용하여 생성된 예측을 점수화하여, 비디오 내용에 대한 모델의 이해도와 생성 능력을 종합적으로 측정하고자 합니다. 이를 통해 비디오 대화 시스템의 성능 최적화와 응용 프로그램 개발을 촉진합니다."

VideoInstruct