HyperAIHyperAI
منذ 17 أيام

شبكة ت.Convolutionية رسمية منظمة لتقدير وضعية الإنسان ثلاثية الأبعاد

{Wei Tang, Zhiming Zou}
شبكة ت.Convolutionية رسمية منظمة لتقدير وضعية الإنسان ثلاثية الأبعاد
الملخص

أظهرت الشبكة التلافيفية الرسومية (GCN) مؤخرًا أداءً واعدًا في تقدير وضعية الإنسان ثلاثية الأبعاد (HPE) من خلال نمذجة العلاقات بين أجزاء الجسم. ومع ذلك، تعاني معظم الطرق السابقة القائمة على GCN من عيوب رئيسية. أولاً، تُستخدم تحويلات ميزة واحدة مشتركة لكل عقدة داخل طبقة تلافيفية رسومية، مما يمنعها من تعلم علاقات مختلفة بين المفاصل المختلفة. ثانيًا، يُعرَّف الرسم البياني عادةً وفقًا لهيكل العظام البشرية، وهو غير مثالي لأن الأنماط الحركية للإنسان غالبًا ما تتجاوز الاتصالات الطبيعية بين المفاصل. لمعالجة هذه القيود، نقدّم GCN مُعدّلًا جديدًا لتقدير وضعية الإنسان ثلاثية الأبعاد. يتكون هذا النموذج من مكونين رئيسيين: تنظيم الوزن وتنظيم الارتباط. يتعلم تنظيم الوزن متجهات تنظيم مختلفة لكل عقدة، بحيث تُفصل تحويلات الميزات بين العقد المختلفة مع الحفاظ على حجم نموذج صغير. أما تنظيم الارتباط، فيقوم بتعديل هيكل الرسم البياني في GCN، مما يسمح بنمذجة حواف إضافية تتجاوز هيكل العظام البشرية. وقد قمنا بدراسة عدة طرق لتنظيم الارتباط، بالإضافة إلى تأثير العوامل الت.REGULARIZATION. أظهرت الدراسة التفصيلية الدقيقة أن كلا النوعين من التنظيم يحسّنان الأداء بتكاليف هامشية. مقارنةً بالطرق المتطورة الحالية لتقدير وضعية الإنسان ثلاثية الأبعاد، يقلل نهجنا بشكل كبير من أخطاء التقدير، مثلاً بنسبة تقارب 10٪، مع الحفاظ على حجم نموذج صغير، أو يقلل بشكل كبير من حجم النموذج، مثلاً من 4.22 مليون إلى 0.29 مليون (بخفض بنسبة 14.5 مرة)، مع تحقيق أداء مماثل. أظهرت النتائج على بنيتين معياريتين أن GCN المُعدّل لدينا يتفوق على بعض الطرق المتطورة الحديثة. يمكن الوصول إلى الكود الخاص بنا عبر الرابط: https://github.com/ZhimingZo/Modulated-GCN.

شبكة ت.Convolutionية رسمية منظمة لتقدير وضعية الإنسان ثلاثية الأبعاد | أحدث الأوراق البحثية | HyperAI