Flex.2-preview est un modèle de diffusion de texte en image publié par Ostris le 24 avril 2025.
Caractéristiques principales :
Génération de texte en image : générez des images de haute qualité en fonction des descriptions de texte saisies, prenez en charge la saisie de texte jusqu'à 512 jetons et comprenez les descriptions complexes pour générer le contenu d'image correspondant.
Fonction de retouche intégrée : prend en charge la retouche ou le remplacement de zones spécifiques d'une image. L'utilisateur fournit l'image de retouche et le masque de retouche, et le modèle génère un nouveau contenu d'image dans la zone spécifiée.
Entrée de contrôle générale : prend en charge plusieurs entrées de contrôle, telles que des graphiques linéaires, des graphiques d'état et des graphiques de profondeur, pour guider la direction de la génération d'images.
Ce didacticiel utilise une seule carte RTX 4090 comme ressource et prend uniquement en charge les invites en anglais.
2. Exemples de projets
3. Étapes de l'opération
1. Après avoir démarré le conteneur, cliquez sur l'adresse API pour accéder à l'interface Web
Si « Bad Gateway » s'affiche, cela signifie que le modèle est en cours d'initialisation. Étant donné que le modèle est grand, veuillez patienter environ 1 à 2 minutes et actualiser la page.
2. Après être entré sur la page Web, vous pouvez démarrer une conversation avec le modèle
Comment utiliser
La première fois que vous clonez, vous devez ouvrir manuellement le flux de travail dans le dossier et le charger.
4. Discussion
🖌️ Si vous voyez un projet de haute qualité, veuillez laisser un message en arrière-plan pour le recommander ! De plus, nous avons également créé un groupe d’échange de tutoriels. Bienvenue aux amis pour scanner le code QR et commenter [Tutoriel SD] pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats de l'application↓