HyperAI

Tutoriel En Ligne : ByteDance Ouvre Le Framework De Génération D'images InfiniteYou Pour Réaliser Une Migration Haute Fidélité Des Traits Du Visage

特色图像

InfiniteYou (InfU en abrégé) est un framework de génération d'images à identité préservée basé sur Diffusion Transformers récemment lancé par ByteDance Intelligent Creation.Il utilise une technologie de pointe pour maintenir la cohérence de l'identité de la personne lors de la génération d'images, c'est-à-dire qu'il peut conserver avec précision les traits du visage lors de la génération d'images de différentes scènes..

En tant que l'un des premiers cadres dans ce domaine à utiliser les transformateurs diffus (DiT), InfU aborde systématiquement trois problèmes fondamentaux des méthodes existantes : une similarité d'identité insuffisante, un biais d'alignement image-texte et une mauvaise qualité de génération et des performances esthétiques médiocres. Son innovation principale, InfuseNet, injecte des fonctionnalités d’identité dans le modèle de base DiT via des connexions résiduelles, améliorant considérablement la fidélité de l’identité tout en maintenant les capacités de génération. Une stratégie de formation en plusieurs étapes comprenant une pré-formation et un réglage fin supervisé (SFT) avec des données synthétiques multi-échantillons mono-personne (SPMS) est adoptée pour optimiser davantage l'alignement image-texte, améliorer la qualité de génération et atténuer efficacement l'effet de duplication du visage.Des expériences approfondies montrent qu'InfU atteint des performances de niveau SOTA, surpassant les méthodes de base existantes dans tous les aspects..

Actuellement, le didacticiel « InfiniteYou High-Fidelity Image Generation Demo » a été lancé dans la section didacticiel du site Web officiel HyperAI.Si vous êtes intéressé, venez l'essayer vous-même !

Adresse du tutoriel:

https://go.hyper.ai/xQnpS

Essai de démonstration

1. Connectez-vous à hyper.ai, sur la page Tutoriels, sélectionnez InfiniteYou High-Fidelity Image Generation Demo, puis cliquez sur Exécuter ce tutoriel en ligne.

2. Une fois la page affichée, cliquez sur « Cloner » dans le coin supérieur droit pour cloner le didacticiel dans votre propre conteneur.

3. Sélectionnez les images « NVIDIA RTX A6000 » et « PyTorch ». La plateforme OpenBayes propose quatre méthodes de facturation. Vous pouvez choisir « Payer au fur et à mesure » ou « Quotidien/Hebdomadaire/Mensuel » selon vos besoins. Cliquez sur « Continuer ».Les nouveaux utilisateurs peuvent s'inscrire en utilisant le lien d'invitation ci-dessous pour obtenir 4 heures de RTX 4090 + 5 heures de temps CPU gratuit !

Lien d'invitation exclusif HyperAI (copier et ouvrir dans le navigateur) :

https://openbayes.com/console/signup?r=Ada0322_NR0n

4. Attendez que les ressources soient allouées. Le premier processus de clonage prend environ 2 minutes. Lorsque le statut passe à « En cours d'exécution », cliquez sur la flèche de saut à côté de « Adresse API » pour accéder à la page de démonstration. Veuillez noter que les utilisateurs doivent effectuer l'authentification par nom réel avant d'utiliser la fonction d'accès à l'adresse API.

Affichage des effets

1. Après avoir accédé à la page de démonstration, téléchargez d'abord une photo contenant un visage dans « Image d'identité », puis entrez l'invite et sélectionnez la version du modèle dans « Version du modèle ». Ici, « aes_stage2 » est utilisé par défaut pour obtenir de meilleurs effets d'alignement et de génération d'images et de textes. Si vous avez besoin d'une similarité d'ID plus élevée, essayez « sim_stage1 ». Dans « Image de contrôle [facultatif] », vous pouvez télécharger une image de contrôle du visage. Le modèle extraira 5 points clés du visage pour contrôler la génération. Ce n’est pas un élément nécessaire. Enfin, cliquez sur « Générer » pour générer l’image.

2. Une photo de Yann Lecun est téléchargée ici, et vous pouvez voir que l'effet généré est plutôt bon.

*invite : Un gentleman sophistiqué qui respire la confiance. Il est vêtu d'une veste à carreaux marron des années 1990 à col haut, associée à un col roulé gris foncé. Son pantalon est ajusté et de couleur anthracite, complété par une élégante ceinture en cuir. L'arrière-plan présente une élégante bibliothèque avec des étagères, une cheminée en marbre et un éclairage chaleureux, créant une atmosphère raffinée et chaleureuse. Sa posture détendue et sa position décontractée, la main dans la poche, ajoutent à son comportement composé et élégant.

Ce qui précède est le tutoriel recommandé par HyperAI cette fois-ci. Venez l'essayer par vous-même !

Adresse du tutoriel:https://go.hyper.ai/xQnpS