AgentFormer: نماذج تحويلية واعية بالوكلاء للتنبؤ متعدد الوكلاء الزمني الاجتماعي

التوقع الدقيق للمسارات المستقبلية لعدة وكالات أمر بالغ الأهمية لأنظمة التحكم الذاتي، لكنه يُعدّ تحديًا بسبب التعقيد الناتج عن التفاعل بين الوكالات والغموض المحيط بسلوك كل وكالة في المستقبل. يتطلب توقع مسارات الوكالات المتعددة نمذجة بعدَين رئيسيين: (1) البعد الزمني، حيث نُعدّل تأثير الحالات السابقة للوكلاء على حالاتهم المستقبلية؛ و(2) البعد الاجتماعي، حيث نُعدّل كيف تؤثر حالة كل وكالة على غيرها. تعتمد معظم الطرق السابقة على نمذجة هذين البعدين بشكل منفصل، مثلاً: أولاً باستخدام نموذج زمني لاستخلاص الميزات عبر الزمن لكل وكالة بشكل مستقل، ثم نمذجة تفاعل هذه الميزات المستخلصة باستخدام نموذج اجتماعي. ورغم فعالية هذا النهج، فإنه غير مثالي، إذ أن ترميز الميزات بشكل منفصل على البعد الزمني أو البعد الاجتماعي قد يؤدي إلى فقدان جزء من المعلومات. بدلًا من ذلك، نفضل استخدام طريقة تسمح لحالة وكالة في لحظة زمنية معينة بأن تؤثر مباشرة على حالة وكالة أخرى في المستقبل. ولتحقيق ذلك، نقترح نموذجًا جديدًا من نماذج الترانسفيرمر يُدعى AgentFormer، والذي يُنمذج البُعد الزمني والاجتماعي معًا. يستخدم النموذج تمثيلًا تسلسليًا للمسارات متعددة الوكالات من خلال تسطيح ميزات المسارات عبر الزمن والوكالات. وبما أن العمليات القياسية للانتباه لا تأخذ بعين الاعتبار هوية الوكالة لكل عنصر في التسلسل، فإن AgentFormer يستخدم آلية انتباه جديدة تعتمد على الوعي بوجود الوكالة، حيث تُراعى هويات الوكالات من خلال معالجة عناصر الوكالة نفسها بشكل مختلف عن عناصر الوكالات الأخرى. استنادًا إلى AgentFormer، نقترح نموذجًا احتماليًا لتوقع مسارات الوكالات المتعددة، قادرًا على الانتباه إلى ميزات أي وكالة في أي لحظة سابقة عند استنتاج الموقع المستقبلي لوكالة معينة. كما يُنمذج الهدف الخفي لجميع الوكالات بشكل مشترك، مما يسمح للغموض في سلوك وكالة واحدة بأن يؤثر على سلوك الوكالات الأخرى. وقد أدى هذا النهج إلى تحسين كبير في الأداء مقارنة بأفضل النماذج الحالية على مجموعات بيانات معروفة في مجال المشاة والقيادة الذاتية.