HyperAIHyperAI

Command Palette

Search for a command to run...

Gemini Robotics 1.5 يُدخل الوكلاء الذكية إلى العالم المادي

أعلنت جوجل عن تطور كبير في مجال الروبوتات الذكية مع إطلاق نموذج Gemini Robotics 1.5، الذي يمثل خطوة جوهرية نحو تحقيق الذكاء الاصطناعي العام (AGI) في العالم المادي. يعتمد النظام على نموذجين متكاملين يعملان معًا ضمن إطار "عوامل ذكية" (agentic framework) لتمكين الروبوتات من أداء مهام معقدة تتطلب التفكير والخطة والتفاعل مع البيئة. النموذج الأول، Gemini Robotics-ER 1.5، يُعد "الدماغ العالي" للروبوت، يُخطط ويُتخذ قرارات منطقية في بيئات مادية، ويُظهر تفوقًا في الفهم المكاني، ويتفاعل بلغة طبيعية، ويُقدّر تقدم المهمة ونجاحها. كما يمكنه استخدام أدوات مثل بحث جوجل أو وظائف مُعرفة من قبل المستخدمين. أما النموذج الثاني، Gemini Robotics 1.5، فهو نموذج يجمع بين الرؤية واللغة والتنفيذ، ويُترجم التعليمات النصية إلى خطوات فعلية، مع إمكانية شرح تفكيره بلغة بسيطة، مما يعزز الشفافية في اتخاذ القرار. يُعد هذا التكامل مفتاحًا لتمكين الروبوتات من تنفيذ مهام متعددة الخطوات، مثل فرز النفايات حسب قواعد محلية، حيث يبحث النظام عن المعلومات المطلوبة، ويحلل الأشياء أمامه، ثم ينفذ الخطوات اللازمة بذكاء. وقد أظهر النموذج أداءً متفوقًا في 15 معيارًا أكاديميًا للتفكير المادي، بما في ذلك اختبارات الفهم المكاني، التوجيه، والتحليل السياقي. من أبرز إنجازات النموذج قدرته على التعلم عبر أنواع مختلفة من الروبوتات (أي "الإدماج الجسدي" – embodiment transfer)، حيث يمكنه نقل المهارات من روبوت إلى آخر دون إعادة تدريب، مثل تطبيق مهارة تم تدريبها على روبوت ALOHA 2 على روبوتات بشرية (Apollo) وروبوتات ذات ذراعين (Franka)، والعكس. في سياق المسؤولية، تم تطوير نماذج أمان متقدمة تضمن سلامة الروبوتات في البيئات البشرية. يشمل ذلك التفكير في الجوانب الأمنية قبل التنفيذ، والحفاظ على التفاعل الودي مع البشر وفق سياسات جوجل للذكاء الاصطناعي، وتفعيل أنظمة مراقبة الاصطدام داخليًا. كما تم تحديث معيار ASIMOV لاختبار السلامةsemantic، مع تحسينات في التغطية، والتعليقات، وأنواع الأسئلة، ودمج مقاطع فيديو، وقد أظهر النموذج تفوقًا في هذه الاختبارات. يُعد إطلاق Gemini Robotics 1.5 خطوة أساسية نحو روبوتات ذكية قادرة على التفكير والتكيف والعمل بشكل مستقل في عالم مادي معقد. وتم إطلاق النموذج الأولي لـ Gemini Robotics-ER 1.5 للمطورين عبر واجهة برمجة التطبيقات (API) في Google AI Studio، بينما يُتاح النموذج الكامل حاليًا لشركاء مختارة. يُتوقع أن يُسهم هذا التقدم في تسريع تطوير روبوتات أكثر ذكاءً واندماجًا في حياتنا اليومية، مع الحفاظ على المعايير الأخلاقية والسلامة.

الروابط ذات الصلة