التوقع التوزيعي للمسار من الطرف إلى الطرف بناءً على خرائط الشبكة المشغولة

في هذه الورقة، نهدف إلى توقع توزيع المسار المستقبلي لوكيل متحرك في العالم الحقيقي، بالاعتماد على صور المشهد الاجتماعي والمسارات التاريخية. ومع ذلك، يُعد هذا التحدي صعبًا لأن توزيع القيمة الحقيقية (ground-truth) غير معروف وغير قابل للملاحظة، في حين يمكن استخدام عينة واحدة فقط منه لتقديم التدريب النموذجي، مما يجعل النموذج عرضة للتحيز. تتركز معظم الدراسات الحديثة على توقع مسارات متنوعة بهدف تغطية جميع الأنماط الممكنة للتوزيع الحقيقي، لكنها قد تهمل الدقة، مما يؤدي إلى إعطاء وزن زائد للتنبؤات غير الواقعية. لمعالجة هذه المشكلة، نتعلم التوزيع باستخدام الانتروبيا المتماثلة (symmetric cross-entropy) مع استخدام خرائط التواجد (occupancy grid maps) كتقريب صريح ومتوافق مع المشهد للقيمة الحقيقية للتوزيع، مما يُعدّ فعّالًا في معاقبة التنبؤات غير المحتملة. وبشكل خاص، نقدّم إطار عمل مبني على التعلم المعكوس للتعزيز (inverse reinforcement learning) لتنبؤ توزيع المسارات متعددة الأوضاع، حيث يتعلم النموذج التخطيط من خلال شبكة تكرار القيمة التقريبية (approximate value iteration network) بطريقة متكاملة (end-to-end). علاوةً على ذلك، وبناءً على التوزيع المُتوقع، نُنتج مجموعة صغيرة من المسارات التمثيلية باستخدام شبكة تعتمد على مُحول (Transformer) قابلة للتفاضل، حيث يساعد آلية الانتباه في هذه الشبكة على نمذجة العلاقات بين المسارات. وفي التجارب، حقق أسلوبنا أداءً من الطراز الرائد (state-of-the-art) على مجموعة بيانات Stanford Drone وبيانات Intersection Drone.