HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 3 أشهر

مُمَدِّدُ الفاعل ثلاثي الأبعاد: انتشار السياسة مع تمثيلات المشهد ثلاثية الأبعاد

الملخص

نُدمج بين سياسات التشتت (diffusion policies) وتمثيلات المشهد ثلاثية الأبعاد لتحسين التلاعب بالروبوتات. تعتمد سياسات التشتت على تعلم توزيع الإجراءات شرطيًا على حالة الروبوت والبيئة باستخدام نماذج التشتت الشرطي، وقد أظهرت مؤخرًا تفوقها على كل من الطرق التقليدية الثابتة وطرق تعلم توزيع الإجراءات الشرطيّة البديلة. أما السياسات الروبوتية ثلاثية الأبعاد، فهي تعتمد على تمثيلات ميزات المشهد ثلاثية الأبعاد، يتم جمعها من منظور واحد أو أكثر باستخدام كاميرات تُحسِّس العمق، وقد أثبتت قدرتها على التعميم الأفضل مقارنةً بتمثيلاتها ثنائية الأبعاد عبر زوايا كاميرات مختلفة. نُوحد هذين المجالين ونقدّم "3D Diffuser Actor"، وهي بنية سياسة عصبية، تُبنى، عند تلقّيها تعليمات لغوية، تمثيلًا ثلاثي الأبعاد للمنظر البصري، ثم تُشغّل هذا التمثيل لتُجرّب تقليل الضوضاء بشكل تكراري على الدورانات والانزلاقات ثلاثية الأبعاد الخاصة بطرف الروبوت النهائي. في كل تكرار لعملية تقليل الضوضاء، تمثل نموذجنا تقديرات وضع طرف الروبوت كـ"رموز مشهد ثلاثية الأبعاد"، وتنبئ بخطأ الانزلاق والدوران ثلاثي الأبعاد لكل رمز، وذلك عبر تمييز هذه الرموز باستخدام انتباه نسبي ثلاثي الأبعاد تجاه رموز بصرية ولغوية أخرى ثلاثية الأبعاد. يُعدّ 3D Diffuser Actor أحدث حالة من الحالات المتقدمة (SOTA) على مجموعة بيانات RLBench، حيث حقق مكسبًا مطلقًا في الأداء بنسبة 16.3% مقارنةً بالحالة الحالية في البيئة ذات المنظور المتعدد، و13.1% في البيئة ذات المنظور الواحد. أما على معيار CALVIN، فقد تفوق على الحالة الحالية في سياق التعميم على مشاهد غير مرئية مسبقًا، حيث نجح في تنفيذ 0.2 إجراءات إضافية، ما يُمثّل زيادة نسبية بنسبة 7%. كما أثبت فعاليته في العالم الحقيقي من خلال عدد محدود جدًا من الأمثلة التوضيحية. قمنا بتحليل اختيار التصميم المعماري لنموذجنا، مثل تمييز المشهد ثلاثي الأبعاد والانتباه النسبي ثلاثي الأبعاد، وبيّنّا أن جميع هذه العناصر تسهم في تحسين القدرة على التعميم. تشير نتائجنا إلى أن تمثيلات المشهد ثلاثية الأبعاد والنمذجة التوليدية القوية تمثلان المفتاح لتعلم فعّال للروبوتات من خلال الأمثلة.

مستودعات الكود

nickgkan/3d_diffuser_actor
pytorch
مذكور في GitHub

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
مُمَدِّدُ الفاعل ثلاثي الأبعاد: انتشار السياسة مع تمثيلات المشهد ثلاثية الأبعاد | الأوراق البحثية | HyperAI