DESIRE: التنبؤ بالمستقبل البعيد في المشاهد الديناميكية مع الوكلاء التفاعليين

نقدم إطارًا عميقًا عشوائيًا لشفرة الشبكة العصبية المتكررة (RNN) للتنبؤ المستقبلي بسلوك عدة وكلاء تتفاعل مع بعضها في مشاهد ديناميكية، وهو الإطار الذي نطلق عليه اسم DESIRE. يتنبأ DESIRE بفعالية بمواقع الأشياء المستقبلية في عدة مشاهد من خلال: 1) الأخذ بعين الاعتبار الطبيعة متعددة الأوضاع للتنبؤ المستقبلي (أي أن المستقبل قد يختلف بناءً على نفس السياق)، 2) التنبؤ بالنتائج المستقبلية المحتملة واتخاذ قرار استراتيجي بناءً عليها، و3) الاستدلال ليس فقط من تاريخ الحركة السابقة، ولكن أيضًا من سياق المشهد والتفاعلات بين الوكلاء. يتم تحقيق هذه المهام بواسطة نموذج شبكة عصبية واحدة قابلة للتدريب من النهاية إلى النهاية، مع الحفاظ على الكفاءة الحسابية. أولاً، يستخدم النموذج مولدًا شرطيًا أوتوماتيكيًا متغيرًا للحصول على مجموعة متنوعة من عينات التنبؤ المستقبلية الفرضية، والتي يتم تصنيفها وتكرارها بواسطة وحدة التقييم والتكرار المتكررة (RNN). يتم تقييم العينات بالأخذ بعين الاعتبار المكافآت المستقبلية المتراكمة، مما يمكن اتخاذ قرارات استراتيجية طويلة الأمد مشابهة لإطارات IOC. تقوم وحدة الاندماج السياقي للمشهد RNN بتجميع تاريخ الحركة السابقة والسياق الدلالي للمشهد والتفاعلات بين الوكلاء المتعددة بشكل مشترك. يعمل آلية الردود الفعلية على تكرار عملية التصنيف والتكرار لتعزيز دقة التنبؤ بشكل أكبر. نقوم بتقييم نموذجنا على مجموعتين من البيانات متاحتين للعامة: KITTI ومجموعة بيانات طائرات درون ستانفورد. تظهر تجاربنا أن النموذج المقترح يحسن بشكل كبير دقة التنبؤ مقارنة بالطرق الأساسية الأخرى.