Command Palette
Search for a command to run...
Le premier cadre est la place à aller pour la personnalisation du contenu vidéo
Jingxi Chen Zongxia Li Zhichao Liu Guangyao Shi Xiyang Wu Fuxiao Liu Cornelia Fermuller Brandon Y. Feng Yiannis Aloimonos

Résumé
Quel rôle joue la première image dans les modèles de génération vidéo ? Traditionnellement, elle est considérée comme le point de départ spatio-temporel d'une vidéo, servant simplement de graine pour l'animation ultérieure. Dans ce travail, nous révélons une perspective fondamentalement différente : les modèles vidéo traitent implicitement la première image comme un tampon de mémoire conceptuelle, stockant des entités visuelles pour une réutilisation ultérieure durant la génération. En exploitant cette insight, nous démontrons qu’il est possible d’atteindre une personnalisation robuste et généralisable du contenu vidéo dans divers scénarios, en utilisant uniquement 20 à 50 exemples d’entraînement, sans modification d’architecture ni fine-tuning à grande échelle. Cette découverte met en lumière une capacité puissante, jusque-là négligée, des modèles de génération vidéo pour la personnalisation basée sur des références.
Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.