HyperAI

Aujourd’hui, dans l’application Gemini, Google DeepMind dévoile un nouveau modèle d’édition d’images, déjà largement salué lors de ses premières versions préliminaires et reconnu comme le meilleur modèle d’édition d’images au monde. Cette innovation est désormais intégrée directement dans l’application Gemini, offrant aux utilisateurs un contrôle accru pour créer des images parfaites selon leurs envies. L’un des principaux objectifs de cette mise à jour est de préserver fidèlement l’apparence d’une personne ou d’un animal à travers les modifications, même lors de transformations radicales. Depuis le lancement initial de l’édition d’images native dans l’application, l’équipe a travaillé sans relâche pour améliorer la cohérence du rendu, en particulier en matière de ressemblance faciale. Il est en effet crucial que les photos de proches, d’amis ou même de pets restent reconnaissables, même après des ajustements comme une coiffure des années 1960 ou un tutu pour un chihuahua. Une image « presque pareille » mais légèrement fausse peut en effet déranger, et c’est précisément ce que ce nouveau modèle vise à éviter. Avec cette mise à jour, il suffit de fournir une photo à Gemini et de décrire les modifications souhaitées pour personnaliser l’image à sa guise. Les utilisateurs peuvent désormais combiner des photos pour se retrouver dans une scène avec leur animal de compagnie, changer le fond d’une pièce pour visualiser de nouveaux papiers peints ou même se projeter dans des lieux du monde entier — tout en gardant une ressemblance fidèle à l’original. Cette capacité à maintenir l’identité visuelle tout en permettant des créations audacieuses représente une avancée majeure dans l’intelligence artificielle appliquée à l’image. En outre, l’application permet désormais de télécharger l’image modifiée dans Gemini pour la transformer en vidéo animée, ajoutant une dimension interactive et ludique à la création. Ces fonctionnalités ouvrent la voie à une utilisation plus créative et expressive, que ce soit pour des projets personnels, des réseaux sociaux ou des projets artistiques. L’intégration de ce modèle de pointe, développé par Google DeepMind, illustre l’engagement de l’entreprise à repousser les limites de l’intelligence artificielle tout en répondant aux attentes des utilisateurs en matière de qualité, de précision et de naturalité. En résumé, cette nouvelle fonctionnalité transforme l’application Gemini en un outil puissant d’expression visuelle, où la créativité rencontre la fidélité. Grâce à des progrès significatifs dans la compréhension des visages et des détails fins, les utilisateurs peuvent désormais modifier leurs photos avec confiance, en sachant que leur apparence reste reconnaissable. C’est une étape importante vers une interaction plus intuitive et plus humaine entre les utilisateurs et l’intelligence artificielle.

Amélioration majeure de l'édition d'images dans Gemini

Related Links