Command Palette
Search for a command to run...
VAP-Data 시각적 액션 성능 데이터 세트
ByteDance가 홍콩 중문대학교와 협력하여 2025년에 출시한 VAP-Data는 현재 가장 큰 의미 제어 비디오 생성 데이터셋입니다. 관련 연구 논문의 제목은 "비디오 프롬프트: 비디오 생성을 위한 통합 의미 제어목표는 제어된 비디오 생성, 제어된 동작 합성, 다중 모드 비디오 모델에 대한 고품질의 교육 및 평가 벤치마크를 제공하는 것입니다. 이 데이터세트는 엄선된 9만 개 이상의 쌍으로 구성된 샘플을 포함하고 있으며, 컨셉, 스타일, 액션, 샷의 네 가지 의미 범주에 걸쳐 100개의 세부적인 의미 조건을 포괄합니다. 각 의미 범주는 상호 정렬된 여러 비디오 인스턴스 세트를 포함합니다. 비디오 콘텐츠는 조명, 원근법, 장면, 다이내믹스 측면에서 매우 다양한 특징을 보이므로, 교차 의미적이고 정교하게 제어되는 비디오 생성 시스템을 구축하고 모델의 제어 가능성과 일반화 능력에 대한 포괄적인 평가 환경을 제공합니다.
