Grok يتفوق في إجابة أسئلة "بالتدر جيت" بعد تحسينات متعمدة من xAI
من بين الأهداف المميزة التي وضّحها إيلون ماسك لشركة xAI، تبرز الاهتمام الخاص بالقدرة على مساعدة المستخدمين في تجاوز تحديات الألعاب الإلكترونية، لا سيما الألعاب المعقدة مثل Baldur’s Gate. وفقًا لتقرير نُشر مؤخرًا في Business Insider، كان ماسك حريصًا جدًا على تحسين قدرة نموذج الذكاء الاصطناعي "غروك" (Grok) على الإجابة عن أسئلة مفصلة حول اللعبة، لدرجة أن تأخير إطلاق نسخة من النموذج استمر لعدة أيام بسبب رغبته في تحسين الأداء في هذا المجال. وقد اضطر فريق هندسة رفيع المستوى إلى تأجيل مشاريع أخرى لتحسين استجابات غروك، ما يعكس الأولوية التي يُولّيها ماسك لهذا الاتجاه. لكن السؤال المهم الذي يطرح نفسه: هل كان هذا الجهد مبررًا؟ وهل تحقق التحسن المطلوب؟ للاجابة، قمنا بتجربة عملية تُشبه مقارنة أداء معيارية، أطلقنا عليها اسم "بالتوربِنتش" (BaldurBench)، حيث قمنا بطرح خمسة أسئلة عامة حول Baldur’s Gate على غروك، ونماذج الذكاء الاصطناعي الكبرى الأخرى: ChatGPT، كلاود، وغيمني. النتائج أظهرت أن غروك يقدم إجابات دقيقة وغنية بالمعلومات، رغم أن أسلوبه يميل إلى الكثافة في استخدام المصطلحات الخاصة باللاعبين مثل "DPS" و"save-scumming"، ما قد يشكل عائقًا أمام المستخدمين غير المتمرسين. لكنه يُظهر فهماً عميقًا للميكانيكيات، ويُفضّل عرض المعلومات في جداول وتحليلات نظرية (theorycraft)، وهو ما يتوافق مع طبيعة الاهتمامات المعلنة لـ xAI. بالنسبة للفرق الأخرى، تباينت الأساليب: ChatGPT يعتمد على القوائم النقطية والعبارات المختصرة، بينما غيمني يُبرز الكلمات المهمة باستخدام التنسيق البارز. أما كلاود، فقد لفت الانتباه بنهجه التحفظي، حيث أبدى حرصًا كبيرًا على عدم كشف تفاصيل حاسمة قد تُفسد تجربة اللعب، مُختتمًا إجابته بجملة تلطفية: "لا تقلق كثيرًا، فقط العب ما يبدو ممتعًا لك". من المهم التذكير بأن xAI أعلنت سابقًا عن تركيزها على تطوير أداء غروك في مجالات مثل الألعاب، ما يجعل نجاحه في هذا التحدي ليس مفاجئًا بالكامل. ومع ذلك، فإن التحسن الملموس الذي أظهره النموذج بعد التدخل المكثف يدل على قدرة الفريق على تحقيق الأهداف المحددة عندما تُعطى الأولوية. وبما أن النتائج لم تُفوق ما تقدمه النماذج الأخرى، فإن ذلك لا يعني فشلًا، بل يعكس جهدًا مُوجَّهًا وناجحًا في تحقيق التوازن المطلوب. في النهاية، هذه التجربة لا تقيّم فقط كفاءة غروك، بل تسلط الضوء على رؤية ماسك وفريق xAI: ليس فقط بناء نماذج ذكية، بل نماذج قادرة على فهم وتقديم مساعدة حقيقية في سياقات يومية، حتى لو كانت في عالم الألعاب.
