نهج تبديد عام لتنبؤ بوضعية الإنسان ثلاثية الأبعاد في البيئة البرية

تُعدّ عملية التنبؤ بوضعيات الإنسان ثلاثية الأبعاد في السياقات الواقعية، المعروفة أيضًا باسم تنبؤ وضعيات الإنسان، عرضة بالضرورة لتدخلات ضوضائية ناتجة عن تقديرات غير دقيقة للوضعيات ثلاثية الأبعاد والاختناقات البصرية. وللتغلب على هذه التحديات، نقترح نهجًا قائمة على التشتت (diffusion) قادرًا على التنبؤ بالمشاهدات المُشوَّشة المعطاة. نُصِفُّ مهمة التنبؤ كمشكلة إزالة الضوضاء، حيث نعتبر كل من الملاحظة والتنبؤ كسلسلة واحدة تحتوي على عناصر مفقودة (سواء في الملاحظة أو في فترة التنبؤ). ونُعامل جميع العناصر المفقودة كضوضاء، ونُزيلها باستخدام نموذجنا المشروط للتَّشتُّت الزمني. ولتحسين الأداء في فترات التنبؤ الطويلة، نقدّم نموذجًا تدرجيًا زمنيًا للتَّشتُّت. ونُظهر فوائد نهجنا على أربع مجموعات بيانات متاحة للجمهور (Human3.6M، HumanEva-I، AMASS، و3DPW)، حيث يتفوّق على أحدث النماذج المُطورة. علاوةً على ذلك، نُظهر أن إطار عملنا عام بما يكفي ليُحسّن أي نموذج للتنبؤ بالوضعيات ثلاثية الأبعاد كخطوة ما قبل المعالجة لإصلاح المدخلات، وكخطوة ما بعد المعالجة لتحسين المخرجات. تم إتاحة الشيفرة المصدرية عبر الإنترنت: \url{https://github.com/vita-epfl/DePOSit}.