تنبؤ حركة متعددة الأشخاص في الظروف القصوى

تنبؤ حركة الإنسان يهدف إلى التنبؤ بوضعيات المستقبل بناءً على سلسلة من الهياكل العظمية ثلاثية الأبعاد في الماضي. رغم أن هذه المشكلة حظيت باهتمام متزايد مؤخرًا، إلا أنها تم التعامل معها بشكل أساسي للأشخاص المفردين بشكل منعزل. في هذا البحث، نستكشف هذه المشكلة عند التعامل مع البشر الذين يقومون بمهام تعاونية، حيث نسعى إلى توقع حركة المستقبل لشخصين متفاعلين بناءً على سلسلتين من هياكلهم العظمية في الماضي. نقترح آلية انتباه تفاعل متقاطع جديدة تستغل المعلومات التاريخية لكلا الشخصين وتعلم كيفية التنبؤ بالاعتماد المتبادل بين السلاسلين الوضعيتين. بما أنه لا يوجد مجموعة بيانات لتدريب مثل هذه الحالات التفاعلية، فقد جمعنا ExPI (Extreme Pose Interaction)، وهي مجموعة بيانات جديدة لمختبر تفاعل الأشخاص تتضمن راقصين محترفين يؤدون حركات رقص الليندي هوب، والتي تحتوي على 115 سلسلة مع 30 ألف إطار مشروح بمعلومات الوضعيات والأشكال الجسمانية ثلاثية الأبعاد. قمنا بتقييم شبكتنا للتفاعل المتقاطع بشكل شامل على ExPI وأظهرنا أن شبكتنا تتفوق باستمرار على أفضل الأساليب الحالية للتنبؤ بحركة الشخص الواحد في كل من التوقعات قصيرة المدى وطويلة المدى.