HyperAIHyperAI
Back to Headlines

OpenAI's o3 يهزم Grok 4 في مواجهة ذكاء اصطناعي على شكل شطرنج بنتيجة 4-0

منذ يوم واحد

في منافسة مثيرة أُقيمت على منصة كاغل التابعة لجوجل، تصدّر نموذج OpenAI المُعدّل للتفكير، o3، مسابقة الذكاء الاصطناعي في لعبة الشطرنج، ليُسجّل فوزًا ساحقًا على نموذج جروك 4 من تطوير إيلون ماسك، بنتيجة 4-0 في المباراة النهائية. وقد تُوّج o3 باللقب، بينما حلّت جوجل بـGemini 2.5 Pro في المركز الثالث بعد فوزها على o4-mini بنتيجة 3.5-0.5 في مباراة التصنيف الثالث. جاءت هذه المنافسة كجزء من سلسلة تجارب مُتعددة النماذج، حيث شارك ثمانية نماذج ذكاء اصطناعي كبيرة، من بينها o3 وo4-mini من OpenAI، وGrok 4 من xAI، وGemini 2.5 Pro وGemini 2.5 Flash من جوجل، Claude 4 Opus من Anthropic، DeepSeek R1 من DeepSeek، وk2 من Kimi. وتم تنظيم المسابقة بأسلوب كأس خروج المغلوب، من 5 إلى 7 أغسطس، وشهدت تطورًا ملحوظًا في أداء النماذج، خاصة في التفكير الاستراتيجي والقدرة على التنبؤ بالحركات. في الدور قبل النهائي، أظهر جروك 4 أداءً قويًا، واجتاز مبارياته بسهولة، ما جعله المرشح الأبرز للفوز. لكن في المباراة النهائية، تغير كل شيء. وفقًا لتغطية موقع Chess.com، لم يكن هناك أي توازن، إذ سحق o3 خصمه بفوزين متتاليين، ثم تابع بتحقيق نتائج مماثلة، بينما ارتكب جروك 4 أخطاء فادحة ومتكررة، وفق وصف المراقبين. اللاعب العالمي السابق ماغنس كارلسن، الذي شارك في بث مباشر للنهائي على يوتيوب، لم يخفِ استغرابه من أداء جروك، وصفه بـ"الشخص الذي يعلم النظرية فقط، لكنه لا يفهم اللعبة"، مضيفًا أن النموذج "يُرتكب أسوأ الأخطاء الممكنة". النتائج ليست فقط منافسة تقنية، بل تُعدّ جزءًا من صراع متزايد بين ماسك وألتمان، المؤسسين المتنازعين لـOpenAI. ففي الأيام الماضية، اشتعلت حرب كلامية بينهما، حيث تهديد ماسك بمقاضاة آبل لتميّزها لصالح OpenAI، ورد ألتمان بتسليط الضوء على سيطرة ماسك على منصة X. وسبق أن نشر ماسك محادثة مع ChatGPT 5 Pro أشار فيها إلى أن ماسك "أكثر موثوقية" من ألتمان، بينما في مايو، استخدم ألتمان جروك لطرح سؤال حول من يجب أن يقود مستقبل الذكاء الاصطناعي، فرد النموذج بأنه يفضل ماسك لتركيزه على السلامة، لكنه أشار إلى أن التكامل بين الاثنين ضروري. النتائج تُظهر تفوّق o3 في المهام الاستنتاجية المعقدة، خاصة في البيئات التي تتطلب تفكيرًا طويل المدى وتحليلًا استراتيجيًا، ما يعزز مكانته كواحد من أقوى النماذج الحالية. في المقابل، يُظهر أداء جروك 4 تراجعًا في التوازن والدقة، رغم محاولاته المبكرة التألق.

Related Links