HyperAIHyperAI
منذ 2 أشهر

PoseAug: إطار قابل للتفاضل لزيادة الوضعية في تقدير وضعية الإنسان ثلاثية الأبعاد

Gong, Kehong ; Zhang, Jianfeng ; Feng, Jiashi
PoseAug: إطار قابل للتفاضل لزيادة الوضعية في تقدير وضعية الإنسان ثلاثية الأبعاد
الملخص

تعاني المُقدِّرات الحالية للوضع البشري ثلاثي الأبعاد من أداء تعميم ضعيف على مجموعات بيانات جديدة، وذلك بشكل كبير بسبب التنوع المحدود لأزواج الوضعيات ثنائية وثلاثية الأبعاد في البيانات التدريبية. لحل هذه المشكلة، نقدم PoseAug، إطارًا جديدًا للتحسين التلقائي يتعلم زيادة تنوع الوضعيات المتاحة في التدريب وبالتالي تحسين قدرة التعميم للمُقدِّر المدرب للتحول من وضعية ثنائية الأبعاد إلى ثلاثية الأبعاد. بصفة خاصة، يُدخل PoseAug مُحسِّن وضعيات جديد يتعلم تعديل عوامل هندسية مختلفة (مثل الوضع، حجم الجسم، زاوية الرؤية والموقع) لوضعية ما عبر عمليات قابلة للتفرقة. بفضل هذه القدرة القابلة للتفرقة، يمكن تحسين المُحسِّن مع المُقدِّر الثلاثي الأبعاد بشكل مشترك واستخدام خطأ التقدير كرد فعل لتوليد وضعيات أكثر تنوعًا وصعوبة بطريقة مستمرة. بالإضافة إلى ذلك، يُقدم PoseAug فضاء سلسلة حركية واعٍ للأجزاء (Kinematic Chain Space) لتقييم معقولية زوايا المفاصل المحلية ويطور وحدة تمييز بناءً عليه لضمان معقولية الوضعيات المعززة. تمكن هذه التصميمات الدقيقة PoseAug من إنتاج وضعيات أكثر تنوعًا ومعقولية من طرق التعزيز غير المستمرة الحالية، مما يؤدي إلى تعميم أفضل للمُقدِّر. يعتبر PoseAug عامًا ومن السهل تطبيقه على مختلف مُقدِّرات الوضع الثلاثي الأبعاد. تظهر التجارب الواسعة أن PoseAug يجلب تحسينات واضحة على كل من مجموعات البيانات داخل السيناريو وعبر السيناريوهات المختلفة. وبشكل لافت للنظر، يصل إلى نسبة 88.6% من دقة الكشف عن الوضع ثلاثي الأبعاد (3D PCK) على MPI-INF-3DHP تحت إعداد تقييم عبر مجموعات البيانات، مما يمثل تحسنًا بنسبة 9.1% على أفضل طريقة تعزيز بيانات سابقة. يمكن العثور على الشيفرة البرمجية في: https://github.com/jfzhang95/PoseAug.