HyperAIHyperAI
منذ 16 أيام

مُحَوِّل MLP-مُوجَّهٌ بالرسم البياني للتنبؤ بالحركة البشرية القائمة على الهيكل العظمي

Xinshun Wang, Qiongjie Cui, Chen Chen, Shen Zhao, Mengyuan Liu
مُحَوِّل MLP-مُوجَّهٌ بالرسم البياني للتنبؤ بالحركة البشرية القائمة على الهيكل العظمي
الملخص

في السنوات الأخيرة، تم استخدام الشبكات التلافيفية الرسومية (GCNs) على نطاق واسع في توقع حركة الإنسان، ولكن أداؤها لا يزال غير راضٍ. في الآونة الأخيرة، تم استغلال نموذج MLP-Mixer، الذي تم تطويره في البداية لمهام الرؤية الحاسوبية، كبديل واعد لـ GCNs في مجال توقع حركة الإنسان، حيث يحقق أداءً أفضل وكفاءة أعلى مقارنةً بـ GCNs. على عكس GCNs التي يمكنها تمثيل بنية العظام والمفاصل في الهيكل العظمي البشري بشكل صريح من خلال تمثيله كرسم بياني يتكوّن من عقد وحواف، تعتمد MLP-Mixer على طبقات متصلة بالكامل، وبالتالي لا يمكنها تمثيل بنية الرسم البياني هذه بشكل صريح. ولتجاوز هذا التقييد في MLP-Mixer، نقترح نموذجًا جديدًا يُدعى \textit{Graph-Guided Mixer}، الذي يزوّد البنية الأصلية لـ MLP-Mixer بالقدرة على نمذجة البنية الرسومية. وباستخدام التوجيه الرسومي، يمكن لنموذج \textit{Graph-Guided Mixer} التقاط الأنماط المتصلة المحددة داخل تمثيل الهيكل العظمي كرسم بياني بشكل فعّال واستخدامها. في هذه الورقة، نكشف أولًا عن ارتباط نظري بين MLP-Mixer وGCN لم يُستكشف من قبل في الأبحاث الحالية. وبناءً على هذا الارتباط النظري، نقدّم نموذجنا المُقترح \textit{Graph-Guided Mixer}، ونوضح كيف تم إعادة تصميم البنية الأصلية لـ MLP-Mixer لدمج توجيه من الهيكل الرسومي. ثم نُجري تقييمًا واسع النطاق على مجموعات بيانات Human3.6M وAMASS و3DPW، والذي يُظهر أن طريقة عملنا تحقق أفضل أداء مُسجّل حتى الآن.

مُحَوِّل MLP-مُوجَّهٌ بالرسم البياني للتنبؤ بالحركة البشرية القائمة على الهيكل العظمي | أحدث الأوراق البحثية | HyperAI