HyperAIHyperAI
منذ 2 أشهر

تنبؤ حركة متعددة الأشخاص في ثلاثية الأبعاد باستخدام متحولات متعددة المدى

Wang, Jiashun ; Xu, Huazhe ; Narasimhan, Medhini ; Wang, Xiaolong
تنبؤ حركة متعددة الأشخاص في ثلاثية الأبعاد باستخدام متحولات متعددة المدى
الملخص

نقترح إطارًا جديدًا لتنبؤ مسارات الحركة ثلاثية الأبعاد لعدة أشخاص. الملاحظة الأساسية لدينا هي أن سلوك الإنسان وأفعاله قد تعتمد بشكل كبير على الأشخاص المحيطين به. لذلك، بدلاً من تنبؤ مسارات الحركة لكل شخص بشكل مستقل، نقدم نموذج متغيرات متعددة المدى (Multi-Range Transformers) يحتوي على مُشفِّر نطاق محلي للحركة الفردية ومُشفِّر نطاق عالمي للتفاعلات الاجتماعية. يقوم مُفكِّك المتغيرات (Transformer decoder) بعد ذلك بتنبؤ الحركة لكل شخص باستخدام وضعية الجسم المقابلة كاستعلام، حيث يتم الانتباه إلى خصائص كل من المُشفِّر النطاق المحلي والمُشفِّر النطاق العالمي. لا يقتصر نموذجنا على التفوق على الأساليب الرائدة في مجال التنبؤ بالحركة ثلاثية الأبعاد على المدى الطويل فحسب، بل إنه يولد أيضًا تفاعلات اجتماعية متنوعة. وبشكل أكثر إثارة للاهتمام، يمكن لنموذجنا حتى تنبؤ حركة 15 شخصًا في آن واحد من خلال تقسيم الأشخاص تلقائيًا إلى مجموعات تفاعل مختلفة. صفحة المشروع مع الكود متاحة على الرابط: https://jiashunwang.github.io/MRT/.

تنبؤ حركة متعددة الأشخاص في ثلاثية الأبعاد باستخدام متحولات متعددة المدى | أحدث الأوراق البحثية | HyperAI