SimAug: تعلّم تمثيلات قوية من المحاكاة للتنبؤ بالمسار

يدرس هذا البحث مشكلة توقع المسارات المستقبلية للأشخاص في كاميرات غير معروفة ضمن سيناريوهات ومشاهد جديدة. نعالج هذه المشكلة من خلال نموذج خالٍ من البيانات الحقيقية، حيث يتم تدريب النموذج فقط على بيانات محاكاة ثلاثية الأبعاد، ثم تطبيقه مباشرة على مجموعة واسعة من الكاميرات الحقيقية. نقترح منهجية جديدة لتعلم تمثيلات قوية من خلال تعزيز بيانات التدريب في المحاكاة، بحيث يمكن للتمثيل التعميم بشكل أفضل على بيانات الاختبار الواقعية غير المرئية. الفكرة الأساسية تكمن في خلط ميزة أصعب وجه كاميرا مع الميزة المعاكسة للوجه الأصلي. نشير إلى منهجيتنا باسم $ extit{SimAug}$. ونُظهر أن $ extit{SimAug} $ تحقق نتائج واعدة على ثلاث معايير واقعية باستخدام بيانات تدريب حقيقية صفرية، كما تحقق أداءً من الدرجة الأولى في مجموعتي بيانات Stanford Drone وVIRAT/ActEV عند استخدام بيانات تدريب داخل النطاق. تم إصدار الشفرة والنماذج على الرابط: https://next.cs.cmu.edu/simaug