HyperAIHyperAI
منذ 11 أيام

تعلم الديناميكيات البصرية طويلة المدى باستخدام شبكات تفاعل اقتراح المناطق

Haozhi Qi, Xiaolong Wang, Deepak Pathak, Yi Ma, Jitendra Malik
تعلم الديناميكيات البصرية طويلة المدى باستخدام شبكات تفاعل اقتراح المناطق
الملخص

يُعدّ تعلّم نماذج الديناميكية على المدى الطويل عنصرًا محوريًا لفهم المعرفة المشتركة بالفيزياء. تتجنّب معظم الطرق الحالية التي تتعلّم الديناميات من الإدخال البصري التنبؤات طويلة المدى من خلال اللجوء إلى إعادة التخطيط السريع باستخدام نماذج قصيرة المدى. وهذا لا يقتصر فقط على الحاجة إلى دقة فائقة في هذه النماذج، بل يُحدّ من استخدامها فقط في المهام التي يمكن فيها للعامل الحصول باستمرار على ردود فعل واتخاذ إجراءات في كل خطوة حتى الانتهاء. في هذه الورقة، نهدف إلى الاستفادة من أفكار النجاحات السابقة في مهام التعرف البصري لبناء تمثيلات كائنية قادرة على التقاط التفاعلات بين الكائنات وبين الكائنات والبيئة على مدى طويل. ولتحقيق ذلك، نقترح شبكة التفاعل المقترحات الإقليمية (RPIN)، التي تحلّل مسار كل كائن في فضاء ميزات مقترحات إقليمية خفية. وبفضل التمثيل الكائني البسيط ولكنه الفعّال، يتفوّق نهجنا على الطرق السابقة بشكل ملحوظ من حيث جودة التنبؤ وقدرته على التخطيط للمهام اللاحقة، كما يُظهر أداءً جيدًا في التعميم على بيئات جديدة. يُمكن الوصول إلى الكود، والنماذج المُدرّبة مسبقًا، ونتائج التصور الإضافية من خلال الرابط: https://haozhi.io/RPIN.

تعلم الديناميكيات البصرية طويلة المدى باستخدام شبكات تفاعل اقتراح المناطق | أحدث الأوراق البحثية | HyperAI