Command Palette
Search for a command to run...
Ditto-1M 명령어 기반 비디오 편집 데이터 세트
Ditto-1M은 홍콩과학기술대학교, 앤트 그룹, 저장대학교 및 기타 기관에서 2025년에 발표한 명령 기반 비디오 편집 데이터셋입니다. 관련 논문 결과는 다음과 같습니다.고품질 합성 데이터 세트를 사용한 스케일링 지침 기반 비디오 편집"는 자연어 명령어를 기반으로 한 비디오 편집 모델 개발을 촉진하고, 대규모 고품질 합성 샘플을 통해 모델의 복잡한 명령어 이해도와 비디오 생성 정확도를 개선하는 것을 목표로 합니다. 이 데이터세트는 약 1,000,000개의 고화질 비디오 편집 트리플을 포함하고 있으며, 각 트리플은 원본 비디오, 편집 지침, 그리고 편집된 비디오로 구성됩니다. 각 비디오는 평균 101개의 프레임과 1,280×720 해상도를 갖습니다. 편집 작업은 세 가지 범주로 나뉩니다.
- 글로벌 스타일 전환: 예술적 스타일 변경, 색상 등급, 시각 효과 등을 포함합니다.
- 글로벌 자유형 편집: 복잡한 장면 수정, 환경 변화, 창의적인 변형 등을 포함합니다.
- 로컬 편집: 정확한 객체 수정, 속성 변경, 로컬 조정 등이 포함됩니다.

데이터 세트 예제