الاجتماعي-الضمني: إعادة التفكير في تقييم توقع المسار وفعالية التقدير الاحتمالي الأقصى الضمني

يُعد مقياس متوسط الخطأ في الازاحة (ADE)/ متوسط الخطأ في الازاحة النهائي (FDE) لـ Best-of-N (BoN) أكثر المقاييس استخدامًا لتقييم نماذج توقع المسارات. ومع ذلك، فإن BoN لا يُقيّم جميع العينات المولّدة بشكل كامل، مما يؤدي إلى رؤية غير كاملة لجودة وأداء النموذج في التنبؤ. نقترح مقياسًا جديدًا يُسمى متوسط المسافة الماهالانوبس (AMD)، والذي يُعالج هذه المشكلة. يقيس AMD مدى قرب جميع العينات المولّدة من الحقيقة المطلقة (ground truth). كما نُقدّم أيضًا مقياسًا جديدًا يُسمى متوسط القيمة الذاتية القصوى (AMV)، الذي يقيس التباعد العام للتنبؤات. وقد تم التحقق من صحة المقاييس الجديدة تجريبيًا، حيث أظهرت النتائج أن ADE/FDE غير حساسة لتغيرات التوزيع، مما يُعطي انطباعًا متحيّزًا بالدقة، في المقابل، فإن مقاييس AMD/AMV لا تعاني من هذه المشكلة. كما نُقدّم استخدام تقنية التقدير الضمني للlikelihood الأقصى (IMLE) كبديل للنماذج التوليدية التقليدية في تدريب نموذجنا Social-Implicit. إن آلية تدريب IMLE تتماشى مع الهدف من AMD/AMV، وهو التنبؤ بمسارات تكون قريبة من الحقيقة المطلقة وذات تباعد ضيق. يُعدّ Social-Implicit نموذجًا عميقًا فعّالًا من حيث الذاكرة، ويحتوي فقط على 5.8 ألف معلمة، ويُنفّذ بسرعة حقيقية تصل إلى حوالي 580 هرتز، ويحقق نتائج تنافسية. يمكن مشاهدة عرض تفاعلي للمسألة عبر الرابط: https://www.abduallahmohamed.com/social-implicit-amdamv-adefde-demo . كما يتوفر الكود المصدر عبر: https://github.com/abduallahmohamed/Social-Implicit.