il y a 2 mois

Jiangning Zhang Junwei Zhu Zhenye Gan Donghao Luo Chuming Lin Feifan Xu Xu Peng Jianlong Hu Yuansen Liu Yijia Hong

Résumé

Nous proposons un cadre piloté par multimodalité pour l'animation de personnages numériques à haute fidélité sur de longues durées, nommé Soul, qui génère des vidéos sémantiquement cohérentes à partir d'une seule image de portrait, de promts textuels et d'audio, atteignant une synchronisation labiale précise, des expressions faciales vivantes et une conservation robuste de l'identité. Nous avons construit Soul-1M, comprenant 1 million d'échantillons soigneusement annotés, grâce à un pipeline d'annotation automatisée précise (couvrant des scènes de portrait, de corps entier, de buste et de scènes à plusieurs personnes), afin de pallier le manque de données, et nous avons soigneusement conçu Soul-Bench pour une évaluation complète et équitable des méthodes d'animation guidées par l'audio ou le texte. Le modèle repose sur le noyau Wan2.2-5B, intégrant des couches d'injection audio et plusieurs stratégies d'entraînement, combinées à un remplacement du codebook sensible au seuil, afin d'assurer la cohérence de la génération à long terme. Par ailleurs, la distillation par étape et par CFG, ainsi qu'une VAE légère, sont utilisées pour optimiser l'efficacité de l'inférence, permettant une accélération de 11,4 fois avec une perte de qualité négligeable. Des expériences étendues montrent que Soul surpasser significativement les modèles open-source et commerciaux actuels en termes de qualité vidéo, d'alignement vidéo-texte, de conservation de l'identité et de précision de la synchronisation labiale, démontrant ainsi son large potentiel d'application dans des scénarios du monde réel, tels que les animateurs virtuels ou la production cinématographique.

PDF source Voir le code

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

il y a 2 mois

Vision Par Ordinateur

Tâche

Jiangning Zhang Junwei Zhu Zhenye Gan Donghao Luo Chuming Lin Feifan Xu Xu Peng Jianlong Hu Yuansen Liu Yijia Hong

Résumé

PDF source Voir le code

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

il y a 2 mois

Vision Par Ordinateur

Tâche

Jiangning Zhang Junwei Zhu Zhenye Gan Donghao Luo Chuming Lin Feifan Xu Xu Peng Jianlong Hu Yuansen Liu Yijia Hong

Résumé

PDF source Voir le code

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Soul : Donner vie à une humanité numérique pour une animation multimodale de haute fidélité à long terme

Jiangning Zhang Junwei Zhu Zhenye Gan Donghao Luo Chuming Lin Feifan Xu Xu Peng Jianlong Hu Yuansen Liu Yijia Hong7 more

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Soul : Donner vie à une humanité numérique pour une animation multimodale de haute fidélité à long terme

Jiangning Zhang Junwei Zhu Zhenye Gan Donghao Luo Chuming Lin Feifan Xu Xu Peng Jianlong Hu Yuansen Liu Yijia Hong7 more

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Soul : Donner vie à une humanité numérique pour une animation multimodale de haute fidélité à long terme

Jiangning Zhang Junwei Zhu Zhenye Gan Donghao Luo Chuming Lin Feifan Xu Xu Peng Jianlong Hu Yuansen Liu Yijia Hong7 more

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Jiangning Zhang Junwei Zhu Zhenye Gan Donghao Luo Chuming Lin Feifan Xu Xu Peng Jianlong Hu Yuansen Liu Yijia Hong

Jiangning Zhang Junwei Zhu Zhenye Gan Donghao Luo Chuming Lin Feifan Xu Xu Peng Jianlong Hu Yuansen Liu Yijia Hong

Jiangning Zhang Junwei Zhu Zhenye Gan Donghao Luo Chuming Lin Feifan Xu Xu Peng Jianlong Hu Yuansen Liu Yijia Hong