Command Palette
Search for a command to run...
DeGCN: شبكات ت.Convolution الرسومية القابلة للتشوه للتمييز عن الحركة القائمة على الهيكل العظمي
DeGCN: شبكات ت.Convolution الرسومية القابلة للتشوه للتمييز عن الحركة القائمة على الهيكل العظمي
Guijin Wang Jing-Hao Xue Nan Su Woomin Myung
الملخص
تم دراسة الشبكات التلافيفية الرسومية (GCN) مؤخرًا لاستغلال البنية الشبكية للجسم البشري في التعرف على الأفعال القائمة على الهيكل العظمي. ومع ذلك، فإن معظم هذه الأساليب تجمع المعلومات عبر نمط غير مرن ينطبق على عينات الأفعال المختلفة، مما يفتقر إلى الوعي بالتباين الداخلي للطبقات والملاءمة لسلسلة الهيكل العظمي، والتي غالبًا ما تحتوي على روابط زائدة أو حتى ضارة. في هذه الورقة، نقترح شبكة تلافيفية رسومية قابلة للتشويه (DeGCN) جديدة، لالتقاط المفاصل الأكثر إفادة بشكل تكيفي. تتعلم DeGCN المقاييس القابلة للتشويه في كل من الرسومات المكانية والزمنية، مما يمكّن النموذج من إدراك مجالات استقبال تمييزية. وبشكل ملحوظ، وبما أن الأفعال البشرية بطبيعتها مستمرة، يتم تعريف الميزات الزمنية في فضاء خفي مستمر. علاوةً على ذلك، قمنا بتصميم إطار عمل متفرع مبتكر، والذي لا يحقق توازنًا أفضل بين الدقة وحجم النموذج فحسب، بل يعزز أيضًا بشكل كبير من تأثير التجميع بين نمطي المفاصل والعظام. أظهرت التجارب الواسعة أن الطريقة المقترحة تحقق أداءً متقدمًا جدًا على ثلاث قواعد بيانات شائعة الاستخدام: NTU RGB+D وNTU RGB+D 120 وNW-UCLA.