Command Palette
Search for a command to run...
WithAnyone : Vers une génération d'images contrôlable et cohérente en identité

Résumé
La génération d’identité cohérente est devenue un enjeu majeur dans la recherche sur la génération d’images à partir de texte. Les modèles récents ont obtenu des résultats remarquables en produisant des images alignées avec une identité de référence. Toutefois, le manque de grands jeux de données appariés contenant plusieurs images du même individu pousse la plupart des approches à adopter une stratégie d’apprentissage basée sur la reconstruction. Cette dépendance entraîne fréquemment un mode de défaillance que nous désignons sous le nom de copy-paste, où le modèle reproduit directement le visage de référence au lieu de préserver l’identité face aux variations naturelles de posture, d’expression ou d’éclairage. Une telle sur-similarité compromet la maîtrise du processus de génération et limite son expressivité. Pour remédier à ces limites, nous proposons : (1) la construction d’un grand jeu de données apparié, MultiID-2M, spécifiquement conçu pour des scénarios multi-personnes, offrant ainsi une diversité de références par identité ; (2) l’introduction d’un benchmark permettant de quantifier à la fois les artefacts de type copy-paste et le compromis entre fidélité à l’identité et variation ; (3) un nouveau paradigme d’apprentissage reposant sur une perte d’identité contrastive, qui exploite les données appariées pour équilibrer fidélité et diversité. Ces contributions se concrétisent dans WithAnyone, un modèle basé sur la diffusion qui atténue efficacement le phénomène de copy-paste tout en préservant une forte similarité d’identité. Des expérimentations qualitatives et quantitatives étendues démontrent que WithAnyone réduit significativement les artefacts de copy-paste, améliore la maîtrise des variations de posture et d’expression, et maintient une qualité perceptuelle élevée. Des études utilisateurs confirment en outre que notre méthode permet d’atteindre une haute fidélité d’identité tout en assurant une génération expressive et contrôlable.
Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.