HyperAIHyperAI
منذ 2 أشهر

PolarNet: السحابات ثلاثية الأبعاد للتحكم الروبوتي الموجه باللغة

Shizhe Chen; Ricardo Garcia; Cordelia Schmid; Ivan Laptev
PolarNet: السحابات ثلاثية الأبعاد للتحكم الروبوتي الموجه باللغة
الملخص

القدرة على فهم الروبوتات وتفيذ مهام التلاعب بناءً على تعليمات اللغة الطبيعية هي هدف طويل الأمد في مجال الروبوتات. تواجه النهج المهيمنة للتلاعب بقيادة اللغة صعوبات في دمج كاميرات متعددة الزوايا واستنتاج مواقع ثلاثية الأبعاد وعلاقات دقيقة. لمعالجة هذه القيود، نقترح سياسة تعتمد على السحابة النقطية ثلاثية الأبعاد تُسمى PolarNet للتلاعب بقيادة اللغة. تستفيد من مدخلات السحابة النقطية المصممة بدقة، ومُشفِّرات السحابة النقطية الفعالة، ومنشِّطات متعددة الأوضاع لتعلم تمثيلات السحابة النقطية ثلاثية الأبعاد ودمجها مع تعليمات اللغة للتنبؤ بالأفعال. أثبتت PolarNet فعاليتها وكفاءتها في البيانات من خلال مجموعة متنوعة من التجارب التي أجريت على مقاييس RLBench. تتفوق على أفضل الأساليب ثنائية وثلاثية الأبعاد في التعلم المفرد والمتعدد المهام. كما حققت نتائجًا واعدةً على روبوت حقيقي.

PolarNet: السحابات ثلاثية الأبعاد للتحكم الروبوتي الموجه باللغة | أحدث الأوراق البحثية | HyperAI