HyperAI

Google's Gemini 2.5 Pro تعيش حالة من الذعر أثناء لعب Pokémon المواجهة بين شركات الذكاء الاصطناعي في صناعة الألعاب في السعي المستمر لشركات الذكاء الاصطناعي مثل جوجل وأنثروبوميك للاستحواذ على السوق، تظهر بعض النتائج المثيرة للضحك والتفكر عند ملاحظة كيف يتعامل أحدث نماذجها مع ألعاب Pokémon القديمة. تشير تقرير من جوجل ديبمايند إلى أن Gemini 2.5 Pro تدخل في حالة ذعر عندما تكون بوكيموناتها على وشك الموت، مما يؤدي إلى تدهور واضح في قدرتها على المنطق والتفكير. تقييم الذكاء الاصطناعي عبر الألعاب تقييم الذكاء الاصطناعي، أو عملية مقارنة أداء نماذج الذكاء المختلفة، هو فن مشكوك فيه غالبًا ولا يوفر الكثير من السياق حول القدرات الحقيقية للنموذج. ومع ذلك، يعتقد بعض الباحثين أنه يمكن أن يكون مفيدًا (وإلى حد ما ممتعًا) دراسة كيفية تفاعل نماذج الذكاء الاصطناعي مع الألعاب الإلكترونية. خلال الأشهر الماضية، أنشأت مطوران غير منتسبين لجوجل وأنثروبوميك قناة Twitch باسم "Gemini Plays Pokémon" و "Claude Plays Pokémon"، حيث يمكن للمشاهدين متابعة أداء الذكاء الاصطناعي في الألعاب القديمة للأطفال. سلوك الذكاء الاصطناعي في Pokémon تحتوي كل قناة على ترجمة بلغة طبيعية لعملية تقييم الذكاء الاصطناعي للمشكلات ووصوله إلى ردود الفعل، مما يوفر رؤية متعمقة لكيفية عمل هذه النماذج. رغم التقدم الملحوظ، فإن هذه النماذج لا تزال ليست جيدة جدًا في لعب Pokémon. يستغرق Gemini 2.5 Pro مئات الساعات لإكمال اللعبة التي يمكن للأطفال إكمالها في وقت أقل بكثير. الأمر الأكثر إثارة للاهتمام في مراقبة الذكاء الاصطناعي أثناء لعب Pokémon ليس الوقت الذي يستغرقه لإكمال اللعبة، بل سلوكه أثناء اللعب. يدخل Gemini 2.5 Pro في حالات مختلفة من الذعر، مما يؤدي إلى تدهور أدائه. قد تتوقف النموذج عن استخدام الأدوات المتاحة لها لفترات طويلة، وهي سلوك يشبه قرارات الإنسان الفاشلة عند التوتر. هذا السلوك لوحظه بشكل واضح من قبل مشاهدي Twitch، الذين بدؤوا في التعليق عليه. سلوك Claude في Pokémon لم يكن Claude أفضل حالًا. في إحدى الحالات، لاحظ الذكاء الاصطناعي أن عندما تفقد جميع بوكيمونات اللاعب صحتها، يعود اللاعب تلقائيًا إلى مركز بوكيمون. عند عالق Claude في كهف Mt. Moon، افترض خطأً أنه إذا أدى إلى إغماء جميع بوكيموناته، سيتم نقله عبر الكهف إلى مركز بوكيمون في المدينة التالية. لكن هذا ليس صحيحًا، فعندما تموت جميع بوكيموناتك، تعود إلى المركز الذي زرته مؤخرًا، وليس الأقرب جغرافيًا. شاهد المشاهدون بصدمة الذكاء الاصطناعي وهو يحاول قتل نفسه في اللعبة. تفوق الذكاء الاصطناعي في بعض الجوانب رغم هذه العيوب، هناك جوانب أخرى يمكن فيها للذكاء الاصطناعي الانتصار على اللاعبين البشريين. ي excel Gemini 2.5 Pro في حل الألغاز بشكل دقيق. باستخدام بعض المساعدة البشرية، تم إنشاء أدوات موجهة نحو مهام معينة لمساعدة النموذج في حل ألغاز الصخور والعثور على طرق فعالة للوصول إلى الوجهات. "مع مجرد تعليمات تصف فيزياء الصخور وكيفية التحقق من صحة المسار، يتمكن Gemini 2.5 Pro من حل بعض هذه الألغاز المعقدة في محاولة واحدة، وهي ضرورية للتقدم في طريق النصر"، كما ذكر التقرير. نظرًا لأن Gemini 2.5 Pro قامت بجزء كبير من العمل لإنشاء هذه الأدوات بمفردها، فإن جوجل تفترض أن النموذج الحالي قد يكون قادرًا على إنشاء هذه الأدوات دون تدخل بشري. تقييم الحدث من قبل مختصين يعد مراقبة سلوك الذكاء الاصطناعي في الألعاب القديمة مثل Pokémon مفتاحًا مهمًا لفهم قدراته وحدوده. بينما يمكن لهذه النماذج أن تتفوق في بعض المهام المعقدة، تظهر أيضًا نقاط ضعفها في مواجهة التحديات البسيطة. يعتقد الباحثون أن هذه التجارب يمكن أن تساعد في تحسين الذكاء الاصطناعي وتوفير رؤية أعمق حول كيفية تفاعلها مع البيئات المعقدة. نبذة تعريفية عن Google جوجل هي شركة تكنولوجية عملاقة تأسست عام 1998 وتتخذ من كاليفورنيا مقراً لها. تشتهر بمحركها البحثي الشهير، لكنها توسعت بسرعة في مجالات متعددة مثل الذكاء الاصطناعي، الأجهزة الذكية، والخدمات السحابية. قسم جوجل ديبمايند مكرس لتطوير الذكاء الاصطناعي المتقدم وتعظيم قدراته في مجالات مثل الألعاب والتطبيقات العملية.

الروابط ذات الصلة

الروابط ذات الصلة

الروابط ذات الصلة

ما وراء الواقع المرئي: نظام التقييم الجديد في تسينغهوا وورلد أرينا يكشف عن فجوة القدرات في نماذج العالم المجسد

ما وراء الواقع المرئي: نظام التقييم الجديد في تسينغهوا وورلد أرينا يكشف عن فجوة القدرات في نماذج العالم المجسد

Command Palette

"جيميني من غوغل تدخل في حالة ذعر أثناء لعب بوكيمون"

الروابط ذات الصلة

Command Palette

"جيميني من غوغل تدخل في حالة ذعر أثناء لعب بوكيمون"

الروابط ذات الصلة

Command Palette

"جيميني من غوغل تدخل في حالة ذعر أثناء لعب بوكيمون"

الروابط ذات الصلة

ما وراء الواقع المرئي: نظام التقييم الجديد في تسينغهوا وورلد أرينا يكشف عن فجوة القدرات في نماذج العالم المجسد

ما وراء الواقع المرئي: نظام التقييم الجديد في تسينغهوا وورلد أرينا يكشف عن فجوة القدرات في نماذج العالم المجسد