HyperAI

将免费的 OpenRouter API 与谷歌最新推出的 Gemini 2.5 Flash Image（代号“Nano Banana”）结合，可以实现强大的图像生成体验。尽管名字听起来有点搞笑，但这款模型实际表现非常出色——它能精准理解原始图像内容，在不破坏原貌的前提下进行创意修改。我用 Python 在本地测试了这一组合。上传了爱犬 Pepe 的照片，输入“给他戴顶小帽子”“穿上超级英雄披风”“变成90年代情景喜剧爸爸”等指令，结果生成的图像依然保持了 Pepe 的特征，没有出现变形、多眼或异化的问题。这得益于模型对原始图像的上下文记忆能力，不像某些AI会“随机发挥”。整个过程通过 OpenRouter 的统一 API 接口完成。我使用的是 google/gemini-2.5-flash-image-preview:free 模型，请求时设置 modalities=["image", "text"]，返回结果中包含 base64 编码的图像数据。虽然看起来像 URL，实则是包含图像数据的 base64 字符串。为什么用 base64？因为 JSON 格式只支持文本，无法直接传输二进制图像。base64 将图像转为纯文本，便于在 API 中安全传输，也方便嵌入 HTML 或前端代码。Python 中只需用 base64.b64decode 解码，再通过 PIL.Image.open(io.BytesIO(...)) 转为图像对象，即可保存或显示。我封装了两个实用函数：genImage(prompt) 用于发送请求并获取 base64 图像数据，saveImage(image_url) 用于解码并保存为 PNG 文件，支持自定义命名。配合一个简单的循环，就能实现“输入提示 → 生成图像 → 保存”的自动化流程。值得一提的是，OpenRouter 提供了“模型路由”功能，可自动在多个免费模型间切换，确保请求不因某个接口拥堵或宕机而失败。虽然免费用户有速率限制（如每分钟20次，或每天50次，购买10个积分后提升至1000次），但对个人用户和轻量级应用来说，依然非常划算。目前该模型输出固定为 1024x1024 像素，尚不支持自定义宽高比。但整体来看，借助 OpenRouter 和 Nano Banana，普通人也能轻松实现高质量、可控的 AI 图像创作，尤其适合宠物美化、创意设计等场景。唯一遗憾的是——它确实不会生成真正的香蕉。

免费生成惊艳图像：OpenRouter 联手 Gemini Nano-banana 开启AI创作新纪元

Related Links