تقنية محاكاة تتيح للروبوتات تعلم التعامل بمهارة مع الأشياء الصلبة والمalleable
تقنية محاكاة تعليمية تتيح للروبوتات تنفيذ مهام دقيقة باستخدام بيانات تدريب مخصصة عندما تقدم لك نماذج الذكاء الاصطناعي الشهيرة مثل ChatGPT أو Gemini ردودًا تبدو خبيرًا على أسئلتك الملحة، قد لا تدرك مدى الاعتماد على كميات هائلة من المعلومات لتوفير تلك الردود. تعمل هذه النماذج على أساس أنظمة رئيسية تعرف بالأساسيات، والتي يتم تدريبها على مليارات، وأحيانًا تريليونات، نقاط البيانات. في سياق البحث العلمي، طور فريق من الباحثين في معهد ماساتشوستس للتكنولوجيا (MIT) تقنية جديدة تعتمد على المحاكاة لإنشاء بيانات تدريب مخصصة للروبوتات الدقيقة. تقوم كل محاكاة بإنشاء نقطة بيانات تدريبية مفصلة توجه الروبوت عبر طرق مختلفة لمعالجة الأشياء. عندما يتم تطبيق هذه البيانات على السياسة (أو الخطة العملية التي يتبعها الروبوت)، يتوفر للآلة مجموعة متنوعة من الطرق لتنفيذ مهمة معينة، ويمكنها تجربة حركات مختلفة إذا لم تنجح إحداها. أجرى الباحثون تجربة مع زوج من ذراعي روبوت حقيقية، حيث لاحظوا تحسنًا ملحوظًا في أداء الروبوتات عند عملها معًا لقلب صندوق كبير في موقعه المحدد. عندما انحرفت الروبوتات عن المسار المقصود أو تعاملت مع الجسم بشكل غير صحيح، تمكنت من استعادة الأداء خلال المهمة عن طريق الرجوع إلى مسارات بديلة من مكتبة البيانات التعليمية لديها. يضيف Russ Tedrake، أستاذ الكهرباء والحاسوب والطيران والهندسة الميكانيكية في MIT، وهو أيضًا نائب الرئيس الأول للنماذج السلوكية الكبرى في معهد تويوتا للأبحاث ومحقق رئيسي في CSAIL: "حتى توضيح واحد من البشر يمكن أن يجعل مشكلة التخطيط للحركة أسهل بكثير". يرى Tedrake أنه في المستقبل، قد تكون النماذج الأساسية قادرة على توفير هذه المعلومات، وأن هذه التقنية في إنشاء البيانات ستقدم نوعًا من الوصفة بعد التدريب لهذه النماذج. مستقبل PhysicsGen يُخطط الباحثون لتوسيع نطاق تطبيقات PhysicsGen ليشمل مهامًا متنوعة يمكن للروبوت تنفيذها. تقول Yang، باحثة في الفريق: "نرغب في استخدام PhysicsGen لتعليم الروبوت صب الماء عندما تم تدريبه فقط على ترتيب الأطباق، على سبيل المثال". تشير Yang إلى أن خطتهم لا تقتصر على إنتاج حركات ممكنة ديناميكيًا للمهام المألوفة فحسب، بل لها أيضًا القدرة على إنشاء مكتبة متنوعة من التفاعلات الفيزيائية التي يمكن أن تكون بمثابة مكونات بنائية لإنجاز مهام جديدة لم يُظهرها البشر سابقًا. قد تساعد هذه التقنية في إنشاء كميات كبيرة من البيانات التعليمية ذات التطبيق الواسع، مما قد يؤدي في النهاية إلى بناء نموذج أساسي للروبوتات. ومع ذلك، يحذر الباحثون في MIT أن هذا الهدف ما زال بعيد المنال إلى حد ما. يعمل فريق البحث الذي تقوده CSAIL على دراسة كيفية استغلال PhysicsGen للموارد الواسعة وغير المنظمة، مثل مقاطع الفيديو على الإنترنت، كبذور للمحاكاة. الهدف هو تحويل المحتوى البصري اليومي إلى بيانات غنية جاهزة للروبوتات، والتي يمكن أن تعلم الآلات كيفية أداء مهام لم يُظهرها أحد صراحة. تحرص Yang وزملاؤها على جعل PhysicsGen أكثر فائدة للروبوتات ذات الأشكال والتكوينات المتنوعة في المستقبل. لتحقيق ذلك، يخططون للاستفادة من مجموعات البيانات التي تحتوي على توضيحات لروبوتات حقيقية، مع التركيز على كيفية حركة مفاصل الروبوت بدلاً من مفاصل الإنسان. كما يعتزمون دمج التعلم التعزيزي، حيث يتمكن النظام من التعلم عبر التجربة والخطأ، لجعل PhysicsGen قادرة على توسيع قاعدة بياناتها خارج الأمثلة التي يوفرها البشر. قد يقومون بتدعيم خطتهم بتقنيات إدراك متقدمة لمساعدة الروبوت في تحليل وتفسير بيئته بصريًا، مما يتيح له تحليل وتكيف مع تعقيدات العالم المادي. حالياً، تظهر PhysicsGen كيف يمكن للذكاء الاصطناعي مساعدتنا في تعليم روبوتات مختلفة كيفية التعامل مع الأجسام ضمن نفس الفئة، خاصة تلك الصلبة. قد تساهم هذه التقنية قريبًا في مساعدة الروبوتات على العثور على أفضل الطرق لمعالجة الأشياء اللينة (مثل الفواكه) والأجسام القابلة للتشوه (مثل الطين)، لكن تلك التفاعلات ما زالت صعبة المحاكاة.