HiDream-E1.1 : Éditeur d'images Basé Sur Les Commandes
1. Introduction au tutoriel

Le modèle HiDream-E1.1 est un modèle d'édition d'images open source publié par HiDream.ai en juillet 2025. Basé sur son architecture propriétaire Sparse Diffusion Transformer, il prend en charge une résolution de plusieurs mégapixels et est sous licence open source du MIT. Ce modèle implémente des fonctionnalités d'édition d'images en langage naturel (commentez ce que vous dites), permettant aux utilisateurs d'effectuer des tâches complexes telles que l'ajustement des couleurs, le transfert de style, l'ajout et la soustraction d'éléments grâce à des commandes simples, sans compétences logicielles spécifiques.
Ce didacticiel utilise des ressources de calcul A6000 à double GPU et prend en charge le chinois, l'anglais, le français et d'autres langues.
2. Exemples de projets

3. Étapes de l'opération
1. Démarrez le conteneur

2. Après avoir accédé à la page Web, vous pouvez utiliser le modèle
Si le message « Bad Gateway » s'affiche, cela signifie que le modèle est en cours d'initialisation. En raison de la taille importante du modèle, veuillez patienter environ 5 à 6 minutes avant d'actualiser la page. Le traitement des images prend environ 5 à 6 minutes ; merci de votre patience.

4. Discussion
🖌️ Si vous voyez un projet de qualité, n'hésitez pas à laisser un message pour le recommander ! Nous avons également créé un groupe d'échange de tutoriels. N'hésitez pas à scanner le code QR et à commenter [Tutoriel SD] pour rejoindre le groupe et discuter de divers problèmes techniques et partager les effets de l'application.↓

Informations sur la citation
Les informations de citation pour ce projet sont les suivantes :
@InProceedings{fastvlm2025,
author = {Pavan Kumar Anasosalu Vasu, Fartash Faghri, Chun-Liang Li, Cem Koc, Nate True, Albert Antony, Gokul Santhanam, James Gabriel, Peter Grasch, Oncel Tuzel, Hadi Pouransari},
title = {FastVLM: Efficient Vision Encoding for Vision Language Models},
booktitle = {Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)},
month = {June},
year = {2025},
}