無料で使えるGemini Nano-Bananaで画像生成!OpenRouter経由でAIがペットに帽子をかぶせる実験
Googleが新たに発表した「Gemini 2.5 Flash Image」(通称「Nano Banana」)と、無料AI API統合プラットフォーム「OpenRouter」の組み合わせが、画像生成の新たな可能性を切り開いている。この記事では、実際の体験を通じて、無料で高品質な画像生成が可能かどうかを検証する。筆者は自宅の愛犬「ペペ」の写真に、帽子やスーパーヒーローカペを加えるなど、テキストプロンプトで変形させたが、生成された画像は元の犬の特徴を保ち、不自然な変化やエラーが発生しなかった。これは、モデルが元画像の内容を記憶し、一貫性を保って変換している証拠。特に、他のAIモデルが「ハルシネーション」を起こす中で、Nano Bananaは「記憶」に基づいた生成を実現している点が注目される。 この技術を実現したのが、OpenRouterのAPI。中国在住の筆者は、GoogleやGitHubへのアクセス制限がある中でも、同APIを通じてGeminiモデルにアクセスできた。OpenRouterの最大の強みは「モデルルーティング」機能。複数のAIモデルを設定することで、1つ目のエンドポイントが応答しない場合、自動でバックアップモデルに切り替える仕組み。これにより、安定したAPI利用が可能になる。無料プランでも、10クレジット以上保有すれば、1日1,000回のリクエストが可能。実際の使用では、58種類の無料モデルが利用可能で、1日約6万回のリクエストが潜在的に可能。これは、無料サービスとしては非常に高い水準だ。 画像生成の実装は、Pythonで実行可能。requestsとPillowライブラリをインストールし、OpenRouterのエンドポイントにプロンプトを送信。応答で返されるのはBase64エンコードされた画像データ。これは、JSON形式でテキストとして扱えるようにするための標準的手法。このBase64文字列をデコードし、Pillowで画像として読み込むことで、ローカルに保存・表示が可能。筆者は、生成と保存を関数化し、繰り返し利用できる仕組みを構築。現状、出力サイズは固定の1024×1024ピクセルで、アスペクト比の調整は未対応。 結論として、OpenRouterとGemini Nano Bananaの組み合わせは、無料で高品質な画像生成が可能であり、特に記憶保持型のAI生成という点で他を凌駕している。ただし、リクエスト制限や出力サイズの制約は考慮が必要。それでも、個人開発者やクリエイターにとって、Photoshopを使わずに簡単に画像加工できる画期的なツールとして注目されるべきだ。