فريق مختبر نويا آرك من هواوي وغيرهم يطرح إطار عمل جديد يدمج أنظمة تشغيل الروبوتات مع نماذج كبيرة لتحقيق التحكم بلغة طبيعية
طوّر باحثون من مختبر نوح للأقمار الصناعية التابع لهواوي في لندن، إلى جانب جامعتي دارمشتات التقنية وزوريخ، إطار عمل جديد يجمع بين أنظمة تشغيل الروبوتات (ROS) ونماذج اللغة الكبيرة (LLMs) لتمكين الروبوتات من فهم الأوامر البشرية بتنسيق طبيعي وتنفيذها بدقة. نُشر هذا الإطار في دورية "Nature Machine Intelligence"، ويهدف إلى سد الفجوة بين قدرات الذكاء الاصطناعي اللغوي والتنفيذ المادي للروبوتات في البيئات الحقيقية مثل المنازل والمكاتب. يعمل النظام الجديد على ترجمة الأوامر النصية التي يصدرها المستخدم، مثل "التقط المكعب الأخضر وضعه على الرف الأسود"، إلى سلسلة من الإجراءات الروبوتية القابلة للتنفيذ. يعتمد النموذج على استخدام نماذج اللغة الكبيرة لفهم السياق وتخطيط الخطوات المطلوبة، ثم تحويل هذه الخطط إلى أوامر يمكن لنظام التشغيل الروبوتي (ROS) معالجتها. ويتميز الإطار بمرونة عالية في طرق التنفيذ؛ حيث يمكن للنموذج كتابة كود قابل للتنفيذ مباشرة (Inline Code) للتحكم الفوري، أو استخدام أشجار السلوك (Behavior Trees) التي تنظم القرارات وتوفر بدائل في حال فشل إجراء معين. كشفت التجارب التي شملت مجموعة متنوعة من الروبوتات عن نتائج واعدة للغاية. أظهرت النتائج أن الروبوتات المدعومة بهذا الإطار تستطيع تنفيذ مهام معقدة طويلة الأمد، مثل ترتيب الطاولة، والتكيف الديناميكي مع المتغيرات، والتحكم عن بعد بمساعدة المشرفين البشريين. كما أثبتت الأنظمة مرونتها وقابليتها للتوسع في سيناريوهات مختلفة، مع القدرة على تعلم مهارات ذرية جديدة عبر التقليد، وتحسين أدائها باستمرار من خلال التغذية الراجعة من البيئة أو من البشر. يُعد هذا التقدم حاسماً لأن الروبوتات المستقلة التي تحول الأوامر اللغوية إلى أفعال مادية موثوقة لا تزال تشكل تحدياً مركزياً في مجال الذكاء الاصطناعي. يؤكد الباحثون أن هذا الحل لا يعتمد على نماذج مخصصة باهظة الثمن، بل يستخدم نماذج لغوية كبيرة مفتوحة المصدر ومُعدة مسبقاً، مما يسهل اعتماد التقنية على نطاق واسع. وقد تم إصدار الكود المصدري الكامل للإطار العمل كمصدر مفتوح مجاني، مما يفتح الباب أمام المطورين والباحثين لتوسيع نطاق تطبيقاته واختباره على روبوتات أكثر تعقيداً. يعتقد الفريق أن هذا النهج يمكن أن يمهد الطريق لجيل جديد من الروبوتات القادرة على التفاعل بشكل طبيعي وآمن مع البشر في مساحات العمل والحياة اليومية، مع إمكانية تحسين الأداء مستقبلاً ليشمل بيئات أكثر ديناميكية ومهاماً أكثر تعقيداً.
