تم تحديث Gemini 2.5 بالكامل، Deep Think يدعم ويتفوق على OpenAI

في الصباح الباكر من يوم 21 مايو بتوقيت بكين، وصل مؤتمر Google I/O 2025 في موعده المقرر. وفي كلمته الرئيسية، أعلن الرئيس التنفيذي للشركة، سوندار بيتشاي، عن عدد من التحديثات المهمة، مما يدل بشكل كامل على قدرات جوجل القوية ومعدل نموها في مجال الذكاء الاصطناعي.
عادةً، لا نكشف الكثير من المعلومات في الأسابيع التي تسبق مؤتمر I/O، لأننا نحتفظ بأهم النماذج لإصدارها في المؤتمر. ولكن في عصر جيميني، ربما نُطلق أذكى نموذج يوم ثلاثاء من شهر مارس، أو نُعلن عن إنجازات مثيرة مثل AlphaEvolve قبل أسبوع من انطلاقه، كما قال سوندار بيتشاي. في الواقع، يجب على القراء الذين يتابعون Google أن يعرفوا أنه قبل المؤتمر مباشرة، أصدرت الشركة نموذجًا جديدًا بارزًا، AlphaEvolve، والذي رفع توقعات الناس لمؤتمر I/O.
وفي الخطاب الرئيسي الذي انتهى للتو، كان بيتشاي على قدر التوقعات. بالإضافة إلى سلسلة من التحديثات لـ Gemini، أصدر أيضًا أحدث التطورات في Imagen 4 وVeo 3، بالإضافة إلى سماعات الرأس ونظارات XR ومنتجات أخرى. ستقدم هذه المقالة التحديثات الرئيسية⬇️
تحديث سلسلة Gemini 2.5 الكاملة
التفكير العميق قوي
كان تحديث Gemini 2.5 متوقعًا، لكنه كان مليئًا بالمفاجآت أيضًا. أطلقت شركة جوجل طرازها الأكثر ذكاءً حتى الآن، Gemini 2.5 Pro، في شهر مارس/آذار، وأتاحت تحديث إصدار Gemini 2.5 Pro Preview للمطورين قبل أسبوعين. وبعد ذلك أخذت زمام المبادرة في العديد من قوائم تقييم النماذج الكبيرة.
على سبيل المثال،وقد حصلت على 1415 نقطة في معيار البرمجة WebDev Arena، لتتصدر القائمة بنجاح.

لمزيد من استكشاف قدرات التفكير لدى الجوزاء،بدأت شركة جوجل باختبار وضع تفكير متطور يسمى Deep Think.يستخدم هذا النهج تقنيات بحثية جديدة لتمكين النموذج من مراعاة افتراضات متعددة قبل الاستجابة.
من حيث التأثير،يحقق إصدار Gemini 2.5 Pro Deep Think أداءً جيدًا في العديد من المعايير الصعبة، متجاوزًا OpenAI o3 وo4-mini.وتشمل هذه:
* حقق نتائج ممتازة في اختبار USAMO (أولمبياد الرياضيات الأمريكي) لعام 2025؛
* الريادة في LiveCodeBench، وهو معيار صعب لقياس مهارات البرمجة على مستوى المنافسة؛
* الحصول على درجة عالية قدرها 84.0% في اختبار MMMU (اختبار التفكير متعدد الوسائط)، مما يدل على قدرات تفكير متعدد الوسائط ممتازة.

علاوة على ذلك، تم تحديث سلسلة Gemma 3 أيضًا لتلبية احتياجات الذكاء الاصطناعي للأجهزة المحمولة.اقترحت شركة جوجل، بالتعاون مع شركات كوالكوم، وميديا تيك، وسامسونج وغيرها من الشركات المصنعة، إطار عمل متطور جديد، Gemma 3n.ويستخدم تقنية مبتكرة من Google DeepMind - Per-Layer Embeddings (PLE) لتحقيق تحسين كبير في استخدام الذاكرة. على الرغم من أن أحجام المعلمات الأصلية للنماذج هي 5 مليارات (5B) و8 مليارات (8B) على التوالي، مع تقنية PLE، يمكن تشغيل هذه النماذج الأكبر على الأجهزة المحمولة أو في الاستدلال في الوقت الحقيقي من السحابة مع تكلفة ذاكرة تعادل 2 مليار (2B) أو 4 مليار (4B) من نماذج المعلمات، أي أن 2 جيجابايت أو 3 جيجابايت فقط من الذاكرة الديناميكية مطلوبة للتشغيل.
Veo 3 وImagen 4، يلهمان الإبداع
بالمقارنة مع الجيل السابق، لا يتمتع Veo 3 بتحسن كبير في جودة الفيديو فحسب،والأهم من ذلك، تم تحقيق التوليد المتزامن للفيديو والصوت لأول مرة.سواء كان الأمر يتعلق بصوت حركة المرور في شارع المدينة، أو أصوات الطيور في الحديقة، أو حتى المحادثات بين الشخصيات، يمكن لبرنامج Veo 3 إضافة عناصر صوتية تلقائيًا استنادًا إلى المطالبات النصية أو احتياجات المستخدم.
ويتميز النموذج أيضًا بالتفوق في الظواهر الفيزيائية الواقعية مثل مزامنة الشفاه، كما أنه قادر على فهم أوصاف المشاهد المعقدة وترجمتها إلى مقاطع فيديو ديناميكية. حاليا، Veo 3 متصل بالإنترنت. ويستطيع مشتركو Ultra في الولايات المتحدة تجربة هذه الميزة في تطبيق Gemini وFlow، في حين يحتاج مستخدمو المؤسسات إلى الحصول على حقوق الاستخدام من خلال منصة Vertex AI.
يعد Imagen 4 أحد أبرز مميزات هذا التحديث.مع الحفاظ على ميزة إنشاء الصور بسرعة، تم تحسين التعبير عن تفاصيل الصورة بشكل أكبر.سواء كان الأمر يتعلق بالنسج المعقد أو حبات الماء أو شعر الحيوانات، فيمكن تقديمها جميعًا بشكل مثالي.
بالإضافة إلى ذلك، يتميز برنامج Imagen 4 أيضًا بقدرته الممتازة على معالجة الصور الواقعية والمجردة، ويمكنه إنشاء صور عالية الجودة مناسبة للطباعة والعرض والمناسبات الأخرى وفقًا لاحتياجات مختلفة. ومن الجدير بالذكر بشكل خاص أن قدرات الطباعة الخاصة به قد تم تحسينها بشكل كبير، مما يجعله مناسبًا جدًا لصنع بطاقات المعايدة والملصقات وحتى الكتب المصورة. حاليًا، تم دمج Imagen 4 في مجموعات متعددة مثل Gemini وWhisk وVertex AI وشرائح Google Workspace ومقاطع الفيديو والمستندات وما إلى ذلك ليستخدمها المستخدمون.
