HyperAIHyperAI

Command Palette

Search for a command to run...

il y a un mois

Lynx : Vers une génération vidéo personnalisée de haute fidélité

Shen Sang Tiancheng Zhi Tianpei Gu Jing Liu Linjie Luo

Lynx : Vers une génération vidéo personnalisée de haute fidélité

Résumé

Nous présentons Lynx, un modèle à haute fidélité pour la synthèse vidéo personnalisée à partir d'une seule image d'entrée. Basé sur un modèle fondamental open-source de type Diffusion Transformer (DiT), Lynx introduit deux adaptateurs légers afin de garantir une fidélité d'identité optimale. L'adaptateur ID utilise un Perceiver Resampler pour transformer les embeddings faciaux issus d'ArcFace en tokens d'identité compacts, utilisés comme conditionnement. Quant à l'adaptateur Ref, il intègre des caractéristiques VAE denses provenant d'un chemin de référence gelé, injectant des détails fins à travers toutes les couches du transformer via une attention croisée. Ces modules, combinés, permettent une préservation robuste de l'identité tout en maintenant une cohérence temporelle et une réalisme visuel élevés. Sur une base d'évaluation soigneusement sélectionnée comprenant 40 sujets et 20 instructions neutres, menant à 800 cas de test, Lynx a démontré une ressemblance faciale supérieure, une capacité compétitive à suivre les instructions, ainsi qu'une qualité vidéo remarquable, contribuant ainsi à faire progresser l'état de l'art de la génération vidéo personnalisée.

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Lynx : Vers une génération vidéo personnalisée de haute fidélité | Articles de recherche | HyperAI