Gemini 2.5 Flash Image يحصل على ترقية مذهلة بقدرات تصميم صور متطورة
تطلق جوجل تحديثًا جديدًا لمحادثة جيميني بقدرات ذكية في توليد وتحرير الصور تُعرف باسم جيميني 2.5 فلش صورة أو ما يُعرف بـ "نانو بانانا" في التقييمات المجتمعية. يُطرح هذا النموذج اعتبارًا من الثلاثاء في تطبيق جيميني للجميع، وكذلك عبر واجهات برمجة التطبيقات الخاصة بجوجل آي، وبيئة جوجل آي ستوديو، ومنصة فيرتكس آي. يُعد هذا التحديث خطوة استراتيجية من جوجل لتعزيز مكانتها في سباق الذكاء الاصطناعي البصري، خصوصًا بعد تفوق منافسها OpenAI في مجال الصور التوليدية عبر نموذج GPT-4o. يمتاز النموذج الجديد بقدرته على إجراء تحريرات دقيقة للصور بناءً على أوامر لغوية طبيعية مع الحفاظ على تماسك الوجوه والكائنات، ما يقلل من مشكلات التشويه الشائعة في أدوات المنافسين عند تغيير لون ملابس أو إزالة أشخاص من الصور. يتميز النموذج بقدرات متقدمة مثل دمج صور متعددة في صورة واحدة مع الحفاظ على الهوية، ودمج صور أثاث مع تصميم غرفة معيشة وتطبيق لوحة ألوان محددة لخلق مشهد متجانس. كما يدعم التفاعل متعدد الجولات مع النموذج، ما يسمح للمستخدمين بتعديل الصور تدريجيًا وفقًا لطلبات متعددة. تُظهر تجارب تجريبية في منصة LMArena أن النموذج يتفوق على المنافسين في دقة التوليد واتباع التعليمات، وهو ما أكده فريق جوجل آي ديب مايند. جوجل تؤكد أن النموذج يعتمد على معرفة عالمية متقدمة تمكنه من فهم السياقات الواقعية، مما يفتح آفاقًا في مجالات مثل التعليم التفاعلي، حيث يمكن للنموذج تفسير الرسوم اليدوية وتقديم إجابات دقيقة. كما يدعم النموذج إنشاء صور تجارية موحدة، مثل بطاقات عقارات أو شارات موظفين أو نماذج منتجات، من خلال نموذج واحد. يُقدّم النموذج أيضًا خاصية الترميز البصري المخفي SynthID في كل صورة توليدية لتمييزها كمُنشأة بالذكاء الاصطناعي، مما يسهم في مواجهة التلاعب بالصور والصور المزيفة. على الرغم من التقدم، تبقى جوجل حريصة على الحد من الاستخدامات الضارة، حيث تمنع سياسات الخدمة إنشاء صور جنسية غير متفق عليها، مقارنة بمنصات مثل جروك التي سمحَت بخلق صور مُزيفة لمشاهير. يُعد هذا التحديث جزءًا من جهود جوجل لتحسين تجربة المستخدم في مجالات الإبداع والتصميم، خصوصًا في مشاريع تحسين المنازل والحدائق. السعر يبلغ 30 دولارًا لكل مليون من رموز الإخراج، أي 0.039 دولارًا لكل صورة، مع استمرار تسعير الوسائط الأخرى وفقًا لنظام جيميني 2.5 فلش. تتعاون جوجل مع منصات مثل OpenRouter وfal.ai لتوسيع وصول المطورين، بينما تواصل تطوير دقة التوليد الطويل وتحسين الاتساق في التفاصيل.