Command Palette
Search for a command to run...
Jingxi Chen Zongxia Li Zhichao Liu Guangyao Shi Xiyang Wu Fuxiao Liu Cornelia Fermuller Brandon Y. Feng Yiannis Aloimonos

초록
비디오 생성 모델에서 첫 번째 프레임은 어떤 역할을 하는가? 기존에는 비디오의 공간-시간적 시작점으로 간주되며, 이후 애니메이션 생성을 위한 단순한 시드로 여겨져 왔다. 본 연구에서는 이와는 근본적으로 다른 관점을 제시한다. 즉, 비디오 모델은 첫 번째 프레임을 후속 생성 과정에서 재사용할 수 있도록 시각적 엔티티를 저장하는 개념적 메모리 버퍼로 암묵적으로 활용한다는 것이다. 이러한 통찰을 바탕으로, 아키텍처 변경 없이 대규모 미세조정(finetuning) 없이도 20~50개의 학습 예시만으로 다양한 시나리오에서 강건하고 일반화된 비디오 콘텐츠 맞춤화가 가능함을 보여준다. 이는 참조 기반 비디오 맞춤화를 위한 비디오 생성 모델이 보유한 강력하지만 간과되어 온 능력을 드러내는 중요한 발견이다.