التكيف مع الوعي بالغموض في تقدير وضعية الجسم البشري ثلاثي الأبعاد ذاتي التعلم

تقدم تقنيات التقدير ثلاثي الأبعاد للإنسان من خلال الكاميرا أحادية العدسة (monocular 3D human pose estimation) يهيمن عليها الأساليب المراقبة التي تتطلب ملاحظات على نطاق واسع للوضعيات ثنائية وثلاثية الأبعاد (2D/3D pose annotations). غالباً ما تظهر هذه الطرق بشكل غير منتظم في غياب أي إجراء لاستبعاد البيانات الغير مألوفة خارج التوزيع (out-of-distribution data). بهدف معالجة هذا الأمر، نقوم بتحويل تعلم الوضع الثلاثي الأبعاد للإنسان إلى مشكلة تكيف مجال غير مراقب (unsupervised domain adaptation problem). نقدم شبكة MRP-Net التي تتكون من هيكل شبكة عميقة مشترك مع رأسين خرجيين يتبعان تكوينين مختلفين؛ أ) تحديد موقع المفاصل بدون نموذج (model-free joint localization) وب) الانحدار المعلمي القائم على النموذج (model-based parametric regression). يسمح مثل هذا التصميم لنا باشتقاق مقاييس مناسبة لتقييم عدم اليقين في التنبؤ على مستوى الوضع وال khớp. بينما يتم الإشراف فقط على العينات الصناعية المصنفة، فإن عملية التكيف تستهدف تقليل عدم اليقين للصور المستهدفة غير المصنفة بينما يتم زيادة نفس الشيء لبيانات خارج التوزيع شديدة البعد (backgrounds). بالإضافة إلى التكيف بين البيانات الصناعية والواقعية للوضع الثلاثي الأبعاد، فإن عدم اليقين في المفاصل يسمح بتوسيع نطاق التطبيق ليشمل صورًا طبيعية حتى في حالات وجود إخفاء وتقطع. نقدم تقييمًا شاملًا للمقاربة المقترحة ونثبت أداءها الرائد على قواعد بيانات المعايرة.