HyperAI

Tutoriel En Ligne | Yann LeCun, Lauréat Du Prix Turing, Salué ! Xiaohongshu Ouvre La Source d'InstantID, Permettant Aux Utilisateurs De Personnaliser Des Photos Dans Plusieurs Styles Avec Une Seule Photo Originale

特色图像

Il n'y a pas longtemps, un groupe d'ingénieurs post-95 de Xiaohongshu et une équipe de l'Université de Pékin ont publié conjointement le projet open source « InstantID ».Téléchargez simplement une photo et cet outil photo AI peut facilement personnaliser les photos AI dans différents styles, disant adieu à l'édition photo fastidieuse.
Une fois InstantID publié, il a attiré une large attention, avec 9,9 000 collections sur GitHub. Yann LeCun, lauréat du prix Turing, a également republié un exemple généré par l'équipe à son image sur son compte social pour exprimer son soutien.

Dans le passé, la génération de texte en image basée sur un sujet nécessitait généralement une formation sur plusieurs ensembles de données contenant le sujet (tels que des personnes, des styles). Les solutions représentatives incluent DreamBooth et LoRA. Cependant, les exigences de stockage élevées et le processus de réglage fin fastidieux de ces solutions ont découragé de nombreux utilisateurs, ce qui a entraîné leur incapacité à être rapidement appliquées dans des scénarios réels. L’émergence d’InstantID a permis de sortir de cette impasse.

Architecture InstantID

Le principe de fonctionnement d'InstantID est principalement divisé en trois parties :
* Intégration d'ID: Extrayez les caractéristiques sémantiques du visage dans Face Embedding via le modèle de reconnaissance faciale pré-entraîné. Cette intégration est riche en informations sémantiques, telles que les traits du visage, les expressions, l’âge, etc., fournissant une base solide pour la génération d’images ultérieure.
* Image Adaptateur:Un module d'adaptation léger est introduit pour combiner les informations d'identité extraites avec des invites textuelles. Grâce au mécanisme d'attention croisée découplée, les images et le texte peuvent influencer indépendamment la génération d'images, tout en conservant les informations d'identité et en contrôlant finement le style de l'image.
* IdentityNet:Il code les caractéristiques complexes de l'image du visage de référence à travers des conditions sémantiques fortes (telles qu'une description détaillée des traits du visage) et des conditions spatiales faibles (telles que l'emplacement des repères du visage). Le processus de génération est guidé par Face Embedding et ne nécessite pas d'informations textuelles. Il ne doit être mis à jour que pour les modules nouvellement ajoutés, en gardant le modèle texte-image pré-entraîné gelé pour garantir la flexibilité.
Laissez la complexité au code et laissez la simplicité aux utilisateurs !InstantID réalise non seulement une avancée technique dans la synthèse d'images personnalisées en temps zéro, mais atteint également une simplicité et une intuitivité extrêmes dans l'expérience utilisateur. Que vous soyez un novice en design ou un maître de l'art, vous pouvez facilement créer des images personnalisées sur cette plateforme. Les scénarios d’application spécifiques incluent :
* Synthèse multi-ID et multi-style
InstantID permet une « coopération transfrontalière » en un clic !

* Synthèse stylisée
Saisissez simplement une photo d'un visage pour générer une variété de photos IA avec des styles personnalisés.

* Synthèse réaliste
Ces images sont-elles vraiment composites ?

* Interpolation d'identifiant
Vous pouvez également combiner les images de Yang Mi et Taylor. (ps : Avec cette fonction, vous pouvez également prédire l'apparence future de votre enfant en fonction du poids du visage des deux parents !)

* Nouvelle synthèse de perspective
Une photo originale + une photo de référence de style = une célébrité polyvalente

* Synthèse sans portrait
Que se passe-t-il lorsque les gens et les animaux fusionnent ?

Il existe tellement de styles parmi lesquels choisir, avez-vous hâte de les essayer ? Ne t'inquiète pas,HyperAI a lancé le tutoriel « InstantID Personalized Photo Generation Demo ».Ce tutoriel a créé l'environnement pour vous. Cliquez sur Cloner pour le démarrer en un clic. Venez réaliser vos « Soixante-douze Transformations » !

Adresse du tutoriel public :

https://hyper.ai/tutorials/31559

Essai de démonstration
1. Connectez-vous à hyper.ai et sur la page Tutoriel, sélectionnez Démo de génération de photos personnalisées InstantID. Cliquez sur Exécuter ce didacticiel en ligne.


2. Une fois la page affichée, cliquez sur « Cloner » dans le coin supérieur droit pour cloner le didacticiel dans votre propre conteneur. Cliquez sur « Suivant : sélectionner le taux de hachage » dans le coin inférieur droit.

3. Après le saut, sélectionnez « NVIDIA GeForce RTX 4090 » et cliquez sur « Suivant : Réviser ».Les nouveaux utilisateurs peuvent s'inscrire en utilisant le lien d'invitation ci-dessous pour obtenir 4 heures de RTX 4090 + 5 heures processeur  GratuitTaux de hachageDurée!
Lien d'invitation exclusif HyperAI (copier et ouvrir dans le navigateur) :https://openbayes.com/console/signup?r=6bJ0ljLFsFh_Vvej

4. Cliquez sur « Continuer l'exécution » et attendez que les ressources soient allouées. Lorsque le statut passe à « En cours d’exécution », cliquez sur « Ouvrir l’espace de travail ».

5. Créez une nouvelle session de terminal sur la page de démarrage et entrez la commande suivante.

cd InstantID

6. Entrez la commande suivante pour exécuter la démo Gradio.

python gradio_demo/app.py

7. Lorsque la ligne de commande affiche « Exécution sur l'URL locale : https://0.0.0.0:8080 », copiez l'adresse API à droite dans la barre d'adresse du navigateur pour accéder à la page InstantID.Veuillez noter que les utilisateurs doivent effectuer l'authentification par nom réel avant d'utiliser la fonction d'accès à l'adresse API.

Affichage des effets

1. Ouvrez la page InstantID, téléchargez une image de personnage et téléchargez une image de référence. Parmi eux, le rôle de l’image de référence est de fixer la position du personnage dans l’image.

2. Améliorez les réglages des paramètres suivants.

*Écrivez les mots-clés de l'image que vous souhaitez générer dans la case « Invite ». Habituellement, l'invite est basée sur l'image initiale. Si l'image téléchargée est celle d'un homme, vous pouvez écrire « un homme ».

*Cliquez sur l'option « Permettre une inférence rapide avec LCM ». Si elle n'est pas activée, la vitesse de génération de l'image sera légèrement plus lente.

*Le sélecteur de style « Modèle de style » peut améliorer les mots d'invite, y compris les effets tels que « Aquarelle » et « Dessin au trait ».

*「IdentityNet strength (pour la fidélité)」Force du visage ou force de l'ID, agit sur l'image du personnage initialement importée. Plus le paramètre est élevé, plus l'image générée est similaire à l'image du personnage. La valeur par défaut est 0,8.

*「Force de l'adaptateur d'image (pour plus de détails)」Force de référence d'image, agit sur l'image de référence, la force détermine la similitude entre l'image générée et l'image de référence, la valeur par défaut est 0,8.

*「Options avancées」Réglage avancé des paramètres.  

*「Invite négative」, mots d'invite négatifs, vous pouvez remplir du contenu que vous ne souhaitez pas que l'image finale générée contienne, comme éviter les mots de mauvaise qualité, etc. 

*Pour « Nombre d'étapes d'échantillonnage », « Échelle de guidage » et « graine », sélectionnez simplement les valeurs par défaut.

*「Randomize seed」Graine aléatoire, activer.

*「Améliorer la région non faciale」 renforce la zone non faciale. Lorsqu'il est activé, il augmentera le poids du sélecteur de style.

3. Cliquez sur « Soumettre » et l'image sera générée en 5 secondes.

À l’heure actuelle, le site Web officiel d’HyperAI a lancé des centaines de tutoriels sélectionnés liés à l’apprentissage automatique, qui sont organisés sous la forme de Jupyter Notebook.
Cliquez sur le lien pour rechercher des tutoriels et des ensembles de données associés :https://hyper.ai/tutorials
Ce qui précède est tout le contenu partagé par HyperAI Super Neural Network cette fois-ci. Si vous voyez des projets de haute qualité, veuillez laisser un message en arrière-plan pour nous les recommander ! De plus, nous avons également créé un « Groupe d'échange de tutoriels de diffusion stable ». Bienvenue aux amis pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats des applications~

Scannez le code QR pour rejoindre le groupe d'échange de tutoriels

Si le code QR pour rejoindre le groupe n'est pas valide, vous pouvez scanner le code QR ci-dessous pour ajouter le compte WeChat de Neuro Star (ID WeChat : Hyperai01), notez « SD Tutorial Exchange Group », et vous pourrez rejoindre le chat de groupe.