Back to Headlines

Google、Geminiに高精度AI画像編集機能を搭載「banana」モデルで競争力強化

12時間前

Googleは、Geminiチャットボットに新たなAI画像生成モデル「Gemini 2.5 Flash Image」を搭載し、画像編集の精度と自然さを大幅に向上させた。このアップデートは、3月にOpenAIが発表したGPT-4oの画像生成機能に対抗する戦略の一環で、ユーザーの操作をより正確に反映するよう設計されている。特に、人物の顔や動物の特徴を維持しながら、自然言語での指示に基づいて画像を編集できる点が強み。たとえば、服の色を変更しても顔が歪むなどの問題を回避できる。 このモデルは、SNS上で「nano-banana」という匿名名で評価され、LMArenaなどのベンチマークでトップクラスの性能を発揮。Google DeepMindのプロダクトリーダー、ニコール・ブリチョヴァ氏は、「視覚品質と指示の理解力が飛躍的に向上した」と語り、ユーザーが実用的な画像を手軽に作成できるようになると強調した。 Gemini 2.5 Flash Imageは、複数の画像や色見本を一つのプロンプトで統合できる「マルチリファレンス対応」や、複数回のやり取り(マルチターン)で編集を進める機能も備え、家庭のインテリアや庭づくりのシミュレーションなど、実用的な使い方を想定している。 一方で、Googleは生成コンテンツの倫理的リスクにも配慮。AI生成画像に視覚的な水紋やメタデータによる識別情報を付加し、深層偽造(deepfake)の拡散を防ぐ。また、Googleの利用規約では「同意のない性的画像の生成」を禁止。これに対し、xAIのGrokは同様の制限がなく、有名人を模した露骨なAI画像の生成が可能だった点と対照的だ。 Geminiの月間ユーザーは4.5億人(7月時点)と、ChatGPTの週間7億人を超えているが、実際の活用率はまだ低い。Googleは、このAI画像機能の強化を通じて、ユーザーの信頼と利用をさらに拡大する狙いだ。

Related Links