HyperAIHyperAI

Command Palette

Search for a command to run...

تعلم الديناميكيات البصرية طويلة المدى باستخدام شبكات تفاعل اقتراح المناطق

Haozhi Qi Xiaolong Wang Deepak Pathak Yi Ma Jitendra Malik

الملخص

يُعدّ تعلّم نماذج الديناميكية على المدى الطويل عنصرًا محوريًا لفهم المعرفة المشتركة بالفيزياء. تتجنّب معظم الطرق الحالية التي تتعلّم الديناميات من الإدخال البصري التنبؤات طويلة المدى من خلال اللجوء إلى إعادة التخطيط السريع باستخدام نماذج قصيرة المدى. وهذا لا يقتصر فقط على الحاجة إلى دقة فائقة في هذه النماذج، بل يُحدّ من استخدامها فقط في المهام التي يمكن فيها للعامل الحصول باستمرار على ردود فعل واتخاذ إجراءات في كل خطوة حتى الانتهاء. في هذه الورقة، نهدف إلى الاستفادة من أفكار النجاحات السابقة في مهام التعرف البصري لبناء تمثيلات كائنية قادرة على التقاط التفاعلات بين الكائنات وبين الكائنات والبيئة على مدى طويل. ولتحقيق ذلك، نقترح شبكة التفاعل المقترحات الإقليمية (RPIN)، التي تحلّل مسار كل كائن في فضاء ميزات مقترحات إقليمية خفية. وبفضل التمثيل الكائني البسيط ولكنه الفعّال، يتفوّق نهجنا على الطرق السابقة بشكل ملحوظ من حيث جودة التنبؤ وقدرته على التخطيط للمهام اللاحقة، كما يُظهر أداءً جيدًا في التعميم على بيئات جديدة. يُمكن الوصول إلى الكود، والنماذج المُدرّبة مسبقًا، ونتائج التصور الإضافية من خلال الرابط: https://haozhi.io/RPIN.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp