نموذج جوجل الجديد يُستخدم المتصفح كمستخدم حقيقي
تُعلن جوجل عن نموذج ذكاء اصطناعي جديد يُسمى جيميني 2.5 كومبيوتر يوسي يُعد خطوة متقدمة في تطوير الوكلاء الذكية القادرة على التفاعل مع واجهات المستخدم عبر المتصفح دون الحاجة إلى واجهات برمجة تطبيقات مُهيأة مسبقًا. يعتمد النموذج على قدرات التعرف البصري والتفكير المنطقي في جيميني 2.5 برو لتحليل الطلبات وتنفيذ مهام مثل ملء النماذج وإرسالها أو التنقل داخل المواقع الإلكترونية. تم تطويره خصيصًا لتمكين الوكلاء الذكية من أداء مهام معقدة داخل واجهات مصممة للبشر وليس للآلات، مثل إضافة عناصر إلى سلة التسوق بناءً على قائمة مكونات أو لعب ألعاب بسيطة مثل 2048. يُمكن استخدامه في اختبار واجهات المستخدم أو تنفيذ مهام تتطلب تفاعلًا مباشرًا مع التطبيقات التي لا تدعم واجهات برمجة تطبيقات. يُعد هذا الإطلاق جزءًا من جهود جوجل المتسارعة في تطوير ميزات الوكيل الذكي في مودي جيميني ومشروع مارينر الذي يُجرب فيه الذكاء الاصطناعي أداء مهام مستقلة داخل المتصفح. يختلف جيميني 2.5 كومبيوتر يوسي عن نموذج تشات جي بي تي أجنت ونموذج كلاود من أنثروبيك في أن نموذج جوجل يقتصر على التفاعل مع المتصفح فقط دون الوصول إلى بيئة نظام التشغيل الكاملة، ما يعني أنه لا يُستخدم حاليًا للتحكم في الملفات أو تطبيقات السطح المكتبية. كما يدعم 13 إجراءً أساسيًا مثل فتح المتصفح، الكتابة، النقر، التمرير، والسحب والإفلات. يتوفر النموذج حاليًا للمطورين عبر منصتي جوجل أي ستوديو وفيرتكس أي أي، مع إمكانية تجربته عبر منصة براوزربيس حيث يمكن مشاهدة النموذج في عمله بسرعة مُضاعفة ثلاث مرات. أظهرت جوجل فيديوهات توضيحية تُظهر أداء النموذج في مهام واقعية مثل تصفح أخبار هاكير نيوس للبحث عن مناقشات شائعة. تؤكد جوجل أن النموذج يتفوق على المنافسين في العديد من معايير التحكم في الويب والهاتف المحمول، مع زمن استجابة أقل. من ناحية السلامة، تم دمج ميزات حماية مباشرة داخل النموذج لمواجهة مخاطر مثل الاستخدام غير المشروع، السلوك غير المتوقع، والهجمات عبر النصوص المُضللة أو المواقع الخبيثة. كما توفر جوجل أدوات تحكم للمطورين تُمكّنهم من منع النموذج من تنفيذ إجراءات خطرة مثل تجاوز حماية CAPTCHA أو التلاعب في أنظمة حساسة. تُشجع الشركة المطورين على اختبار أنظمة الوكيل بعناية قبل الإطلاق، وتُقدّم توجيهات ونصائح مفصلة في وثائقها. يُعتبر هذا النموذج جزءًا من التوجه الأوسع لجوجل نحو بناء وكلاء ذكية قادرة على أداء مهام واقعية ضمن بيئات رقمية معقدة، مع التركيز على الأمان والمسؤولية منذ البداية.