HyperAI

يُعد تدريب الروبوتات على أداء مهام معقدة في بيئات منزلية أو صناعية تحديًا كبيرًا، نظرًا لاحتياجها لبيانات تدريب واقعية ومتنوعة. بينما تُستخدم نماذج الذكاء الاصطناعي التوليدي مثل ChatGPT وClaude في معالجة مهام نصية بفضل تدريبها على كميات هائلة من البيانات النصية، فإن الروبوتات تحتاج إلى تدريب على التفاعل مع الأجسام في بيئة ثلاثية الأبعاد، ما يتطلب مشاهد رقمية واقعية تُحاكي التفاعلات الحقيقية. لكن جمع هذه البيانات من خلال الروبوتات الحقيقية بطيء ومرهق، أما المحاكاة التقليدية فيعتمد غالبًا على نماذج مصغرة لا تعكس فيزياء العالم الحقيقي، أو تتطلب تصميمًا يدويًا مكثفًا لكل مشهد. لحل هذه المشكلة، طوّر باحثون من معهد ماساتشوستس للتكنولوجيا (MIT) ومؤسسة تويوتا للبحث، أداة تُسمى "توليد المشاهد القابلة للتحكم" (steerable scene generation)، التي تُنشئ مشاهد رقمية واقعية ومتعددة للبيئات اليومية مثل المطابخ والصالات والمطاعم. تعتمد الأداة على نموذج توليدي يُعرف بـ"النمذجة التبادلية" (diffusion model)، الذي يحوّل الضوضاء العشوائية إلى صور متماسكة. لكنها تُوجّه هذا النموذج نحو إنشاء مشاهد واقعية من خلال تقنية "بحث شجرة مونت كارلو" (MCTS)، وهي أسلوب استخدمه نموذج AlphaGo لاتخاذ قرارات استراتيجية في لعبة غو. في هذه الحالة، يُستخدم MCTS لبناء المشاهد تدريجيًا، عبر تقييم سلسلة من التصاميم المحتملة، وتحسينها تدريجيًا لتحقيق هدف معين، مثل زيادة الواقعية الفيزيائية أو عدد العناصر القابلة للأكل. أظهرت التجارب أن النظام استطاع تضمين ما يصل إلى 34 عنصرًا في مشهد مطعم بسيط، مقارنة بمتوسط 17 عنصرًا في البيانات التدريبية، مما يدل على قدرته على خلق مشاهد أكثر تعقيدًا من تلك التي تعلّم عليها. كما أظهر أداءً متميزًا في استجابة الأوامر النصية، حيث نجح في تلبية طلبات المستخدمين بدقة تصل إلى 98% في محاكاة خزائن المطبخ و86% في مساحات الإفطار الفوضوية، متفوّقًا على أدوات مماثلة. يمكن للمستخدم أيضًا توجيه النظام لتغيير ترتيب العناصر في مشهد موجود، مثل نقل التفاح من مكان إلى آخر على طاولة، مع الحفاظ على بقية التفاصيل. هذا يُمكّن من إنشاء سيناريوهات تدريب متنوعة بسرعة. يؤكد الباحثون أن قوة النظام لا تكمن فقط في إنشاء مشاهد واقعية، بل في قدرته على تجاوز التوزيعات التدريبية الأصلية، وإنشاء مشاهد "غير مسبوقة" تُعد ضرورية لتدريب الروبوتات على مهام متنوعة. كما يخطط الفريق لتطوير النظام ليُنشئ كائنات جديدة، ويدعم كائنات قابلة للحركة مثل الأدراج أو العلب، مما يعزز تفاعل الروبوتات مع البيئة. يُعتبر هذا العمل خطوة مهمة نحو تدريب روبوتات قادرة على التكيف مع العالم الحقيقي، ويُعد إنجازًا في دمج الذكاء الاصطناعي التوليدي مع التعلم القائم على التقييم (reinforcement learning) لخلق بيئات تدريب متعددة وواقعية. ورغم أنه لا يزال في مرحلة إثبات المفهوم، إلا أن الباحثين يرون فيه طريقًا واعدًا لتمكين الروبوتات من التعلم بكفاءة عالية قبل نشرها في المدن والمنازل.

الروابط ذات الصلة

الروابط ذات الصلة

الروابط ذات الصلة

Command Palette

نظام ذكاء اصطناعي يُولّد بيئات افتراضية متنوعة لتدريب الروبوتات

الروابط ذات الصلة

Command Palette

نظام ذكاء اصطناعي يُولّد بيئات افتراضية متنوعة لتدريب الروبوتات

الروابط ذات الصلة

Command Palette

نظام ذكاء اصطناعي يُولّد بيئات افتراضية متنوعة لتدريب الروبوتات

الروابط ذات الصلة