HyperAIHyperAI

SRPO : La Génération d'images Dit Adieu À l'IA !

1. Introduction au tutoriel

Construire
Licence

SRPO est un modèle de génération de texte en image lancé conjointement par l'équipe Tencent Hunyuan, l'École des sciences de l'Université chinoise de Hong Kong (Shenzhen) et l'École supérieure internationale de Shenzhen de l'Université Tsinghua en septembre 2025. En concevant le signal de récompense comme un signal conditionnel au texte, il permet un ajustement en ligne de la récompense et réduit la dépendance à un réglage fin hors ligne. SRPO intègre la technologie Direct-Align, qui restaure directement l'image d'origine à partir de n'importe quel pas de temps grâce à des priors de bruit prédéfinis, évitant ainsi le problème de suroptimisation aux pas de temps ultérieurs. Les expériences sur le modèle FLUX.1.dev montrent que SRPO peut améliorer significativement le réalisme et la qualité esthétique des images générées, évalués par l'homme. L'efficacité de l'apprentissage est extrêmement élevée et l'optimisation peut être réalisée en seulement 10 minutes. Les résultats de l'article sont les suivants :Alignement direct de la trajectoire de diffusion complète avec les préférences humaines à granularité fine".

Ce tutoriel utilise un seul GPU A6000 comme ressource de calcul. Ce modèle ne prend actuellement en charge que les invites en anglais.

2. Affichage des effets

3. Étapes de l'opération

1. Démarrez le conteneur

Si « Bad Gateway » s'affiche, cela signifie que le modèle est en cours d'initialisation. Étant donné que le modèle est grand, veuillez patienter environ 2 à 3 minutes et actualiser la page.

2. Étapes d'utilisation

Paramètres spécifiques :

  • Invite : Vous pouvez saisir une description textuelle ici.
  • Largeur : Largeur de l'image.
  • Hauteur : La hauteur de l'image.
  • Échelle de guidage : Échelle de guidage, utilisée pour contrôler l'influence des invites de texte sur le résultat final lors de la génération d'images.
  • Étapes d'inférence : Le nombre d'étapes d'inférence contrôle le nombre d'itérations du processus de génération, affectant la qualité de la génération et le temps de calcul.
  • Graine : graine de nombre aléatoire, utilisée pour contrôler la valeur initiale du processus de génération aléatoire.
  • Semences utilisées : La semence utilisée.

4. Discussion

🖌️ Si vous voyez un projet de haute qualité, veuillez laisser un message en arrière-plan pour le recommander ! De plus, nous avons également créé un groupe d’échange de tutoriels. Bienvenue aux amis pour scanner le code QR et commenter [Tutoriel SD] pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats de l'application↓

Informations sur la citation

Les informations de citation pour ce projet sont les suivantes :

@misc{shen2025directlyaligningdiffusiontrajectory,
      title={Directly Aligning the Full Diffusion Trajectory with Fine-Grained Human Preference}, 
      author={Xiangwei Shen and Zhimin Li and Zhantao Yang and Shiyi Zhang and Yingfang Zhang and Donghao Li and Chunyu Wang and Qinglin Lu and Yansong Tang},
      year={2025},
      eprint={2509.06942},
      archivePrefix={arXiv},
      primaryClass={cs.AI},
      url={https://arxiv.org/abs/2509.06942}, 
}