تقدير وضعية الإنسان ثلاثية الأبعاد في البيئة الحقيقية بواسطة التعلم المعادي

في الآونة الأخيرة، تم تحقيق تقدم ملحوظ في تقدير وضعية الإنسان ثلاثية الأبعاد من الصور الأحادية بفضل الشبكات العصبية التلافيفية العميقة (DCNNs). رغم نجاح هذه التقنيات على مجموعات بيانات كبيرة تم جمعها في بيئات المختبر المقيدة، فإن الحصول على شروحات وضعية ثلاثية الأبعاد للصور الطبيعية ما زال صعبًا. لذلك، لا يزال تقدير وضعية الإنسان ثلاثية الأبعاد في البيئة الطبيعية تحديًا. في هذا البحث، نقترح إطارًا للتعلم المعادي، الذي يستخلص بنى وضعية الإنسان ثلاثية الأبعاد التي تم تعلمها من مجموعة البيانات المشروحة بالكامل ويطبقها على الصور الطبيعية ذات الشروحات ثنائية الأبعاد فقط. بدلاً من تعريف قواعد محددة مسبقًا لتقيد نتائج تقدير الوضعية، صممنا تمييزًا متعدد المصادر جديدًا لتمييز الوضعيات الثلاثية الأبعاد المتوقعة عن الحقيقية، مما يساعد في إلزام محرك تقدير الوضعية بإنتاج وضعيات صحيحة من الناحية الأنثروبومترية حتى مع الصور الطبيعية. كما لاحظنا أن تصميم مصدر المعلومات بعناية للتمييز ضروري لتعزيز الأداء. ولذلك، صممنا وصفة هندسية جديدة تحسب المواقع النسبية والمسافات بين المفاصل الجسدية كمصدر معلومات جديد للتمييز. لقد أثبتت فعالية إطار التعلم المعادي الخاص بنا مع الوصفة الهندسية الجديدة من خلال التجارب الواسعة التي أجريت على مقاييس عامة مستخدمة على نطاق واسع. يحسن نهجنا بشكل كبير من الأداء مقارنة بالأساليب الرائدة السابقة.