HyperAIHyperAI

Command Palette

Search for a command to run...

فيلا-إكس: تحسين نمذجة الإجراءات المخفية في نماذج الرؤية واللغة والإجراء

الملخص

أصبحت نماذج الرؤية واللغة والفعل (VLA) نموذجًا شائعًا لتعلم سياسات تشغيل الروبوتات القادرة على اتباع التعليمات اللغوية والتكيف مع السيناريوهات الجديدة. وبدأت الدراسات الحديثة في استكشاف دمج "الإجراءات المُخْفية" — وهي تمثيل مجرد للتغير البصري بين إطارين متتاليين — ضمن عملية التدريب المسبق لنماذج VLA. في هذا البحث، نقدّم "villa-X"، وهي إطار عمل جديد يُعرف بـ "الرؤية واللغة والإجراء المُخفي" (ViLLA)، يُحدث تقدّمًا كبيرًا في نمذجة الإجراءات المُخفيّة بهدف تعلّم سياسات تشغيل روبوتات قادرة على التعميم. تعزز منهجيتنا كلاً من طريقة تعلّم الإجراءات المُخفيّة وطريقة دمجها في التدريب المسبق لنماذج VLA. وبشكل متكامل، تُمكّن هذه المساهمات villa-X من تحقيق أداء متفوّق في بيئات محاكاة متعددة، بما في ذلك SIMPLER وLIBERO، وكذلك على مجموعتين واقعيتين من الروبوتات، تشملان تشغيل المُمسِك (Gripper) وتشغيل اليد الدقيقة (Dexterous Hand). نؤمن أن نموذج ViLLA يحمل إمكانات كبيرة، وأن villa-X يُمثّل أساسًا قويًا للبحث المستقبلي في هذا المجال.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp