Command Palette
Search for a command to run...
MUVR 멀티모달 자르지 않은 비디오 검색 벤치마크
MUVR은 난징항공우주대학교가 난징대학교 및 홍콩공과대학교와 협력하여 2025년에 발표한 멀티모달 무삭제 비디오 검색 작업용 벤치마크 데이터셋입니다. 관련 논문으로는 다음과 같은 것들이 있습니다... MUVR: 다중 레벨 시각적 대응을 갖춘 멀티모달 무편집 비디오 검색 벤치마크이 데이터셋은 장편 비디오 플랫폼 시나리오에서의 비디오 검색 연구를 촉진하기 위해 NeurIPS 2025 데이터셋 및 벤치마크에 선정되었습니다. 이 데이터셋은 빌리빌리(Bilibili)에서 가져온 약 53,000개의 편집되지 않은 동영상, 1,050개의 멀티모달 쿼리, 그리고 84,000개의 쿼리-동영상 매칭 관계를 포함하며, 뉴스, 여행, 댄스 등 다양한 일반적인 동영상 유형을 다룹니다. 매칭 관계의 수준을 명확하게 구분하기 위해, 데이터셋은 6단계의 시각적 대응 수준(복사본, 이벤트, 장면, 인스턴스, 동작 등)을 정의하고, 일대다 검색 설정을 사용합니다. 즉, 각 쿼리는 관련 콘텐츠를 포함하는 여러 개의 완전한 동영상에 대응할 수 있습니다. 쿼리 형식에는 세부적인 검색 요구 사항을 표현하기 위한 긴 텍스트 설명, 동영상 태그 힌트, 마스크 힌트 등이 포함됩니다.
