Social NCE: التعلم المتناظر لتمثيلات حركة واعية اجتماعيًا

يُعد تعلّم تمثيلات حركية واعية بالعوامل الاجتماعية جوهر التقدم الحديث في المشكلات متعددة الوكلاء، مثل تنبؤ حركة البشر وتوجيه الروبوتات في الأماكن المزدحمة. وعلى الرغم من التقدم الواعد، تستمر التمثيلات الحالية التي تُتعلم باستخدام الشبكات العصبية في مواجهة صعوبات في التعميم في التنبؤات المغلقة الدائرة (مثل المسارات المتنبأة التي تتصادم). وتنجم هذه المشكلة في جزء كبير عن الطبيعة غير المستقلة والموزعة بشكل غير منتظم (non-i.i.d.) للتنبؤ التسلسلي، إلى جانب بيانات التدريب غير المتوازنة. بشكل مفهوم، إذا كانت بيانات التدريب تأتي فقط من سلوك البشر في المساحات الآمنة، أي من أمثلة "الإيجابية"، فمن الصعب على خوارزميات التعلّم استيعاب مفهوم الأمثلة "السلبية" مثل الاصطدامات. في هذا العمل، نهدف إلى معالجة هذه المشكلة من خلال نمذجة أمثلة سلبية صريحة من خلال التعلم ذاتي التوجيه: (أ) نقدّم خسارة تباين اجتماعي تُنظم التمثيل الحركي المستخلص من خلال التمييز بين الأحداث الإيجابية الحقيقية والأحداث السلبية المُصَنَّعة؛ (ب) نبني عينات سلبية مفيدة استنادًا إلى معرفتنا السابقة بالظروف النادرة لكن الخطرة. يقلل هذا النهج بشكل كبير من معدلات الاصطدام في خوارزميات التنبؤ بالمسارات الحديثة، وتقنيات التكرار السلوكية (behavioral cloning)، والتعلم القوي (reinforcement learning)، ويتفوق على أفضل الطرق الحالية في عدة معايير معيارية. يمكن الوصول إلى الكود الخاص بنا من خلال الرابط التالي: https://github.com/vita-epfl/social-nce.