تقطير العلاقة الكامنة غير المحلية للتقدير الذاتي التكيفي لموضع الجسم البشري ثلاثي الأبعاد

تستفيد الطرق المتاحة لتقدير وضع الجسم البشري ثلاثي الأبعاد من أشكال مختلفة من الإشراف القوي (وضع الجسم ثنائي أو ثلاثي الأبعاد) أو الإشراف الضعيف (متعدد الزوايا أو العمق). باستثناء المجالات الصناعية أو داخل الاستوديوهات، فإن الحصول على مثل هذا الإشراف لكل بيئة هدف جديدة هو أمر غير مريح للغاية. بهدف حل هذه المشكلة، نعتبر تعلم وضع الجسم ثلاثي الأبعاد كمشكلة تكيف ذاتي تهدف إلى نقل المعرفة المتعلقة بالمهمة من مجال مصدر مُصنَّف إلى مجال هدف تمامًا غير مرتبط. نقترح استنتاج تحويل الصورة إلى الوضع عبر خرائط صريحة اثنتين، وهما تحويل الصورة إلى الكامنة (latent) وتحويل الكامنة إلى الوضع، حيث يكون الأخير هو فك مشفر تم تعلمه مسبقًا من خلال مولد معادل للمنافسة الذاتية يفرض قيودًا مسبقة (prior-enforcing generative adversarial auto-encoder).بعد ذلك، نقدم تقنية التبخير العلقي (relation distillation) كوسيلة لمحاذاة العينات متعددة الوسائط غير المرتبطة، أي الفيديوهات الهدف غير المرتبطة وسلسلة الأوضاع ثلاثية الأبعاد غير المرتبطة. لهذه الغاية، نقترح مجموعة جديدة من العلاقات الغير محلية (non-local relations) لوصف التفاعلات الكامنة للوضع على مدى طويل، على عكس العلاقات التباينية العامة حيث تكون الروابط الإيجابية محصورة في بنية جوار محلية.بالإضافة إلى ذلك، نوفر طريقة موضوعية لقياس درجة عدم المحلية (non-localness) لاختيار مجموعة العلاقات الأكثر فعالية. نقيم مختلف إعدادات التكيف الذاتي ونظهر أداءً رائدًا في تقدير وضع الجسم البشري ثلاثي الأبعاد على مقاييس قياسية.