HyperAIHyperAI

Command Palette

Search for a command to run...

SRPO : La Génération d'images Dit Adieu À l'IA !

Date

il y a 4 mois

Size

2.71 MB

License

Other

Paper URL

2509.06942

1. Introduction au tutoriel

Construire
Licence

SRPO est un modèle de génération d'images à partir de texte, lancé conjointement en septembre 2025 par l'équipe Tencent Hunyuan, l'École des sciences de l'Université chinoise de Hong Kong (Shenzhen) et l'École doctorale internationale de l'Université Tsinghua (Shenzhen). En concevant le signal de récompense comme un signal conditionnel au texte, il permet un ajustement en ligne de la récompense, réduisant ainsi le besoin d'un réglage fin hors ligne. SRPO utilise la technologie Direct-Align, qui permet de reconstruire directement l'image originale à partir de n'importe quel instant grâce à des a priori de bruit prédéfinis, évitant ainsi une sur-optimisation ultérieure. Les expériences menées sur le modèle FLUX.1.dev montrent que SRPO améliore significativement le réalisme et la qualité esthétique des images générées, tels que perçus par l'humain, et que son efficacité d'entraînement est extrêmement élevée, ne nécessitant que 10 minutes pour une optimisation complète. Des articles de recherche associés sont disponibles. Alignement direct de la trajectoire de diffusion complète avec les préférences humaines à granularité fine .

Ce tutoriel utilise un seul GPU A6000 comme ressource de calcul. Ce modèle ne prend actuellement en charge que les invites en anglais.

2. Affichage des effets

3. Étapes de l'opération

1. Démarrez le conteneur

Si « Bad Gateway » s'affiche, cela signifie que le modèle est en cours d'initialisation. Étant donné que le modèle est grand, veuillez patienter environ 2 à 3 minutes et actualiser la page.

2. Étapes d'utilisation

Paramètres spécifiques :

  • Invite : Vous pouvez saisir une description textuelle ici.
  • Largeur : Largeur de l'image.
  • Hauteur : La hauteur de l'image.
  • Échelle de guidage : Échelle de guidage, utilisée pour contrôler l'influence des invites de texte sur le résultat final lors de la génération d'images.
  • Étapes d'inférence : Le nombre d'étapes d'inférence contrôle le nombre d'itérations du processus de génération, affectant la qualité de la génération et le temps de calcul.
  • Graine : graine de nombre aléatoire, utilisée pour contrôler la valeur initiale du processus de génération aléatoire.
  • Semences utilisées : La semence utilisée.

4. Discussion

🖌️ Si vous voyez un projet de haute qualité, veuillez laisser un message en arrière-plan pour le recommander ! De plus, nous avons également créé un groupe d’échange de tutoriels. Bienvenue aux amis pour scanner le code QR et commenter [Tutoriel SD] pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats de l'application↓

Informations sur la citation

Les informations de citation pour ce projet sont les suivantes :

@misc{shen2025directlyaligningdiffusiontrajectory,
      title={Directly Aligning the Full Diffusion Trajectory with Fine-Grained Human Preference}, 
      author={Xiangwei Shen and Zhimin Li and Zhantao Yang and Shiyi Zhang and Yingfang Zhang and Donghao Li and Chunyu Wang and Qinglin Lu and Yansong Tang},
      year={2025},
      eprint={2509.06942},
      archivePrefix={arXiv},
      primaryClass={cs.AI},
      url={https://arxiv.org/abs/2509.06942}, 
}

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp