免费生成惊艳图像:OpenRouter 联手 Gemini Nano-banana 开启AI创作新纪元
将免费的 OpenRouter API 与谷歌最新推出的 Gemini 2.5 Flash Image(代号“Nano Banana”)结合,可以实现强大的图像生成体验。尽管名字听起来有点搞笑,但这款模型实际表现非常出色——它能精准理解原始图像内容,在不破坏原貌的前提下进行创意修改。 我用 Python 在本地测试了这一组合。上传了爱犬 Pepe 的照片,输入“给他戴顶小帽子”“穿上超级英雄披风”“变成90年代情景喜剧爸爸”等指令,结果生成的图像依然保持了 Pepe 的特征,没有出现变形、多眼或异化的问题。这得益于模型对原始图像的上下文记忆能力,不像某些AI会“随机发挥”。 整个过程通过 OpenRouter 的统一 API 接口完成。我使用的是 google/gemini-2.5-flash-image-preview:free 模型,请求时设置 modalities=["image", "text"],返回结果中包含 base64 编码的图像数据。虽然看起来像 URL,实则是包含图像数据的 base64 字符串。 为什么用 base64?因为 JSON 格式只支持文本,无法直接传输二进制图像。base64 将图像转为纯文本,便于在 API 中安全传输,也方便嵌入 HTML 或前端代码。Python 中只需用 base64.b64decode 解码,再通过 PIL.Image.open(io.BytesIO(...)) 转为图像对象,即可保存或显示。 我封装了两个实用函数:genImage(prompt) 用于发送请求并获取 base64 图像数据,saveImage(image_url) 用于解码并保存为 PNG 文件,支持自定义命名。配合一个简单的循环,就能实现“输入提示 → 生成图像 → 保存”的自动化流程。 值得一提的是,OpenRouter 提供了“模型路由”功能,可自动在多个免费模型间切换,确保请求不因某个接口拥堵或宕机而失败。虽然免费用户有速率限制(如每分钟20次,或每天50次,购买10个积分后提升至1000次),但对个人用户和轻量级应用来说,依然非常划算。 目前该模型输出固定为 1024x1024 像素,尚不支持自定义宽高比。但整体来看,借助 OpenRouter 和 Nano Banana,普通人也能轻松实现高质量、可控的 AI 图像创作,尤其适合宠物美化、创意设计等场景。唯一遗憾的是——它确实不会生成真正的香蕉。