HyperAI

초록

비디오 생성 모델에서 첫 번째 프레임은 어떤 역할을 하는가? 기존에는 비디오의 공간-시간적 시작점으로 간주되며, 이후 애니메이션 생성을 위한 단순한 시드로 여겨져 왔다. 본 연구에서는 이와는 근본적으로 다른 관점을 제시한다. 즉, 비디오 모델은 첫 번째 프레임을 후속 생성 과정에서 재사용할 수 있도록 시각적 엔티티를 저장하는 개념적 메모리 버퍼로 암묵적으로 활용한다는 것이다. 이러한 통찰을 바탕으로, 아키텍처 변경 없이 대규모 미세조정(finetuning) 없이도 20~50개의 학습 예시만으로 다양한 시나리오에서 강건하고 일반화된 비디오 콘텐츠 맞춤화가 가능함을 보여준다. 이는 참조 기반 비디오 맞춤화를 위한 비디오 생성 모델이 보유한 강력하지만 간과되어 온 능력을 드러내는 중요한 발견이다.

첫 프레임이 비디오 콘텐츠 커스터마이제이션의 핵심 장소이다

Jingxi Chen Zongxia Li Zhichao Liu Guangyao Shi Xiyang Wu Fuxiao Liu Cornelia Fermuller Brandon Y. Feng Yiannis Aloimonos

초록

AI로 AI 구축

Hyper Newsletters

Command Palette

첫 프레임이 비디오 콘텐츠 커스터마이제이션의 핵심 장소이다

Jingxi Chen Zongxia Li Zhichao Liu Guangyao Shi Xiyang Wu Fuxiao Liu Cornelia Fermuller Brandon Y. Feng Yiannis Aloimonos

초록

AI로 AI 구축

Hyper Newsletters