HyperAIHyperAI

Command Palette

Search for a command to run...

Ditto-1M 명령어 기반 비디오 편집 데이터 세트

Discord에서 논의하기

날짜

7달 전

조직

浙江大学
蚂蚁集团
The Hong Kong University of Science and Technology

Paper URL

2510.15742

라이선스

Non-Commercial

Ditto-1M은 홍콩과학기술대학교, 앤트 그룹, 저장대학교 및 기타 기관에서 2025년에 발표한 명령 기반 비디오 편집 데이터셋입니다. 관련 논문 결과는 다음과 같습니다.고품질 합성 데이터 세트를 사용한 스케일링 지침 기반 비디오 편집"는 자연어 명령어를 기반으로 한 비디오 편집 모델 개발을 촉진하고, 대규모 고품질 합성 샘플을 통해 모델의 복잡한 명령어 이해도와 비디오 생성 정확도를 개선하는 것을 목표로 합니다. 이 데이터세트는 약 1,000,000개의 고화질 비디오 편집 트리플을 포함하고 있으며, 각 트리플은 원본 비디오, 편집 지침, 그리고 편집된 비디오로 구성됩니다. 각 비디오는 평균 101개의 프레임과 1,280×720 해상도를 갖습니다. 편집 작업은 세 가지 범주로 나뉩니다.

  • 글로벌 스타일 전환: 예술적 스타일 변경, 색상 등급, 시각 효과 등을 포함합니다.
  • 글로벌 자유형 편집: 복잡한 장면 수정, 환경 변화, 창의적인 변형 등을 포함합니다.
  • 로컬 편집: 정확한 객체 수정, 속성 변경, 로컬 조정 등이 포함됩니다.
    데이터 세트 예제
    데이터 세트 예제

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp