HyperAI

L’article présente une expérience réussie de génération d’images libre grâce à la combinaison de deux outils innovants : l’API OpenRouter et le modèle d’image récent de Google, surnommé « Nano-Banana » (officiellement Gemini 2.5 Flash Image). Malgré son nom ludique, ce modèle se révèle puissant pour modifier des images tout en préservant l’identité du sujet original. L’auteur, vivant en Chine où l’accès à certaines plateformes comme Google ou GitHub est limité, a testé le modèle via OpenRouter, une interface unifiée qui permet d’accéder à plus de 300 modèles d’intelligence artificielle, y compris des versions gratuites. Le cœur de l’expérience réside dans la capacité de Nano-Banana à comprendre et à conserver les caractéristiques fondamentales d’une image d’origine. L’auteur a ainsi demandé à transformer son chien, Pepe, en un super-héros, puis en un père de sitcom des années 90. Résultat : Pepe reste reconnaissable, sans distorsions inattendues — un avantage majeur par rapport à d’autres modèles qui génèrent souvent des résultats aléatoires ou déformés. OpenRouter joue un rôle clé en offrant un mécanisme de routage automatique des requêtes entre plusieurs modèles, garantissant une disponibilité continue même en cas de surcharge ou de panne d’un endpoint. Cette fonctionnalité, appelée model routing, est particulièrement utile pour les utilisateurs dans des régions à accès restreint. Le service est gratuit, mais avec des limites : 20 requêtes par minute pour les modèles gratuits, ou 1 000 requêtes par jour si au moins 10 crédits sont achetés. Ces limites sont raisonnables pour un accès gratuit, surtout avec la diversité des modèles disponibles. Pour générer une image, l’auteur utilise Python avec les bibliothèques requests et Pillow. Le modèle répond par une chaîne Base64 encodée, non une URL classique. Cette pratique est courante car les APIs basées sur JSON ne peuvent pas transmettre directement des données binaires. Le Base64 permet de convertir l’image en texte sécurisé, facile à intégrer dans des requêtes HTTP. Le code récupère cette chaîne, la décode, puis la transforme en image utilisable grâce à PIL. Deux fonctions ont été créées pour automatiser le processus : genImage(prompt) pour envoyer la requête et obtenir le Base64, et saveImage(image_url) pour sauvegarder et afficher l’image. L’utilisateur peut ainsi créer une boucle interactive : saisir une commande comme « /IMAGINE un chien en astronaute », générer l’image, puis la sauvegarder sous un nom personnalisé. Enfin, une limitation reste : l’aspect ratio est fixe (1024×1024 pixels), sans possibilité de personnalisation pour le moment. Malgré cela, l’ensemble constitue un outil puissant, accessible et efficace pour la création d’images générées par IA, surtout dans un contexte de libre accès et de résilience technique. Évaluation : Cette combinaison OpenRouter + Gemini Nano-Banana est une avancée significative pour les utilisateurs cherchant une alternative gratuite, fiable et performante à des services comme DALL·E ou MidJourney. Les experts du secteur soulignent que la capacité de préservation de l’identité visuelle est un progrès majeur dans les modèles de génération d’images. OpenRouter, en tant qu’intermédiaire unifié, renforce l’écosystème en offrant une accessibilité mondiale, même dans les zones à restrictions. Google, quant à lui, continue de démontrer son leadership dans l’IA multimodale, avec des modèles comme Gemini qui allient précision, rapidité et intégrité visuelle. Ce projet illustre bien la tendance actuelle : l’IA accessible, collaborative et orientée vers l’usage réel.

IA gratuite et puissante : générer des images avec Gemini Nano-Banana via OpenRouter

Related Links