il y a 8 mois

Résumé

Les modèles de diffusion texte-image ont montré des progrès remarquables dans la synthèse d'images de haute qualité à partir de prompts textuels, ce qui stimule les recherches sur l'édition d'images basée sur des prompts, permettant de modifier une image source selon un prompt cible. Malgré ces avancées, les méthodes existantes rencontrent encore trois problèmes clés : 1) une capacité limitée du prompt textuel pour guider la génération d'images cibles, 2) une exploitation insuffisante des relations mot-patch et patch-patch pour ancrer les zones d'édition, et 3) une force d'édition uniforme pour toutes les régions lors de chaque étape de débruitage. Pour résoudre ces problèmes, nous présentons une méthode d'édition adaptative guidée par la vision et améliorée par le masquage (ViMAEdit), dotée de trois innovations clés. Premièrement, nous proposons d'utiliser des plongements d'image comme guide explicite pour renforcer le processus traditionnel de débruitage basé sur des prompts textuels, où une stratégie d'estimation de plongement d'image cible basée sur CLIP est introduite. Deuxièmement, nous élaborons une stratégie d'ancrage itératif des zones d'édition guidée par l'auto-attention, qui exploite itérativement les relations patch-patch transmises par les cartes d'auto-attention pour affiner les relations mot-patch contenues dans les cartes d'attention croisée. Enfin, nous présentons un échantillonnage guidé par la variance spatialement adaptative, qui met en avant les variances d'échantillonnage pour les régions critiques de l'image afin de promouvoir la capacité d'édition. Les résultats expérimentaux démontrent la supériorité de ViMAEdit en matière d'édition par rapport à toutes les méthodes existantes.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

il y a 8 mois

Kejie Wang Xuemeng Song Meng Liu Jin Yuan Weili Guan

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

il y a 8 mois

Kejie Wang Xuemeng Song Meng Liu Jin Yuan Weili Guan

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Débruitage adaptatif guidé par la vision et amélioré par le masque pour l'édition d'images basée sur les prompts

Kejie Wang Xuemeng Song Meng Liu Jin Yuan Weili Guan

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Débruitage adaptatif guidé par la vision et amélioré par le masque pour l'édition d'images basée sur les prompts

Kejie Wang Xuemeng Song Meng Liu Jin Yuan Weili Guan

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Débruitage adaptatif guidé par la vision et amélioré par le masque pour l'édition d'images basée sur les prompts

Kejie Wang Xuemeng Song Meng Liu Jin Yuan Weili Guan

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters