HyperAI초신경

VALUE 비디오 언어 이해 평가 데이터 세트

날짜

3년 전

기관

마이크로소프트

라이선스

其他

카테고리

다운로드 도움말
特色图像

VALUE는 Video-And-Language Understanding Evaluation의 약자로, 비디오 및 언어 이해 평가를 위한 데이터 세트입니다. 이 데이터 세트는 텍스트-비디오 검색, 비디오 질의응답 및 비디오 자막 제공. VALUE의 목표는 광범위한 비디오 유형, 비디오 길이, 데이터 양, 작업 난이도 수준을 포괄하는 것입니다. VALUE는 단일 채널 비디오 시각 정보에만 초점을 맞추는 것이 아니라 비디오 프레임과 관련 캡션의 정보를 활용하는 모델과 여러 작업에 걸쳐 지식을 공유하는 모델도 장려합니다.

VALUE 데이터세트 벤치마크에 사용된 데이터세트는 다음과 같습니다.TVQA , TVR, TVC, How2R, How2QA, 바이올린, VLEP, 유쿡2(YC2C, YC2R), 바텍스