이 데이터 세트는 베이징 대학교와 OpenBayes 베이지안 컴퓨팅이 2025년에 발표한 비디오 인스턴스 편집 데이터 세트입니다. 관련 논문 결과는 다음과 같습니다.VIRES: 스케치 및 텍스트 기반 생성을 통한 비디오 인스턴스 재페인팅"는 비디오 인스턴스 다시 그리기 및 시계열 분할과 같은 작업에 대한 정확한 주석 지원을 제공하는 것을 목표로 합니다.
데이터 세트에는 다음이 포함됩니다.
- SA-V는 마스크 주석을 강화하고, 원본 JSON 파일에 새로운 masklet_continues 필드를 추가했습니다. 이 필드는 base64 디코딩과 pycocotools.mask 도구로 구문 분석할 수 있습니다.
- 85,000개의 교육용 비디오와 1,000개의 평가용 비디오를 포함한 86,000개의 비디오 클립으로, 각 비디오는 24FPS, 512×512 해상도의 이미지 51개로 구성되며, 일련의 구조 스케치와 외관 텍스트 설명이 함께 제공됩니다.

비디오 편집 예시