جوجل تُحدث نموذجها الذكي للصور بتحديث يُطلق عليه "تحديث الموز" لتعزيز التحكم في التعديلات
تُعدّ التحديثات الجديدة في نموذج صور جوجل جيميني خطوة استراتيجية لتعزيز مكانتها في سباق الذكاء الاصطناعي البصري، خاصةً مع تفوق منافسيها مثل OpenAI وMeta. يُطلق على النموذج الجديد اسم Gemini 2.5 Flash Image، ويدخل حيز الاستخدام التدريجي لجميع مستخدمي تطبيق جيميني، بالإضافة إلى المطورين عبر منصات Gemini API وAI Studio وVertex AI. يُعدّ هذا النموذج الأحدث في سلسلة جيميني، ويتميز بقدرات متقدمة في تحرير الصور بناءً على تعليمات لغوية طبيعية، مع الحفاظ على واقعية التفاصيل الحيوية مثل الوجوه والحيوانات، وهو ما يُعدّ تحديًا كبيرًا للعديد من الأدوات المنافسة. فعندما يطلب المستخدم تغيير لون قميص في صورة، تُظهر النماذج الأخرى غالبًا تشوهات في الوجه أو الخلفية، لكن جيميني 2.5 Flash يُنتج نتائج أكثر سلاسة وتماسكًا. أثار النموذج اهتمامًا واسعًا في الأسابيع الأخيرة، حيث ظهر ضمن منصة LMArena لتقييم الذكاء الاصطناعي، باسم وهمي "nano-banana"، مما أثار تساؤلات حول مصدره. لكن جوجل أكدت أن النموذج ينتمي إليها، ويعكس القدرات الحقيقية للنظام الأساسي في جيميني 2.5 Flash. وفقًا لنيكول بريتشوفا، قائدة منتجات نماذج التوليد البصري في جوجل ديب مايند، فإن النموذج يُقدّم تحسنًا كبيرًا في جودة الصور ودقة فهم التعليمات، مما يجعل النتائج قابلة للاستخدام في مشاريع حقيقية، مثل تصميم داخلي أو تصور مشاريع حديقة منزلية. كما يدعم النموذج محادثات متعددة الدورات، ويُمكنه دمج مصادر متعددة في طلب واحد، مثل دمج صورة أريكة وصورة غرفة معيشة وpalette ألوان لخلق مشهد متماسك. في سياق سباق التكنولوجيا، يُعدّ تطوير القدرات البصرية حاسمًا. فبعد إطلاق OpenAI لمحرك الصور في GPT-4o، ارتفع استخدام ChatGPT إلى أكثر من 700 مليون مستخدم أسبوعيًا، بينما تُشير أرقام جوجل إلى 450 مليون مستخدم شهريًا لجيميني، ما يشير إلى فجوة في التفاعل. ولسد هذه الفجوة، تسعى جوجل إلى تعزيز تجربة المستخدم عبر تحسين دقة الصور وسهولة التحكم. ومع ذلك، تُبقي جوجل على قيود أمنية صارمة. فعلى عكس بعض المنصات مثل Grok التي سمحّت بإنشاء صور جنسية مزيفة لمشاهير، تمنع سياسات جوجل إنشاء محتوى جنسي غير مُوافَق عليه. كما تُطبّق جوجل علامات مائية بصرية وبيانات تعريفية في الصور المولّدة لتقليل مخاطر التزييف. لكن هذه التدابير قد لا تكون فعّالة أمام المستخدمين العاديين الذين لا يبحثون عن هذه العلامات. باختصار، يُعدّ Gemini 2.5 Flash Image تطورًا جوهريًا في قدرات جيميني، يُعزّز من مكانتها في مجال الذكاء الاصطناعي البصري، ويُظهر التزامها بموازنة الإبداع مع السلامة، في سياق تنافس شديد مع عمالقة التكنولوجيا.