HyperAIHyperAI
منذ 2 أشهر

شبكة التلافيف الرسومية القائمة على الأجزاء لتمييز الحركات

Kalpit Thakkar; P J Narayanan
شبكة التلافيف الرسومية القائمة على الأجزاء لتمييز الحركات
الملخص

تشمل أفعال البشر حركة مشتركة للأجزاء المتحركة للجسم أو "الحركات" (gestures). يتم تمثيل الهيكل العظمي البشري بشكل حدسي كرسم بياني نادر، حيث تكون المفاصل هي العقد والروابط الطبيعية بينها هي الأضلاع. استخدمت شبكات التلافيف الرسومية لتحديد الأفعال من مقاطع الفيديو الهيكلية. نقدم شبكة تلافيف رسومية قائمة على الأجزاء (PB-GCN) لهذه المهمة، مستوحاة من نماذج الأجزاء القابلة للتشوه (DPMs). نقسم رسم الهيكل العظمي إلى أربعة رسوم فرعية تشترك فيها المفاصل ونتعلم نموذج التعرف باستخدام شبكة تلافيف رسومية قائمة على الأجزاء. نوضح أن مثل هذا النموذج يحسن أداء التعرف مقارنة بنموذج يستخدم رسم الهيكل العظمي بأكمله. بدلاً من استخدام إحداثيات المفاصل ثلاثية الأبعاد كخصائص للعقد، نوضح أن استخدام الإحداثيات النسبية والplacements الزمنية يعزز الأداء. يحقق نموذجنا أفضل النتائج الحالية في مجموعتي بيانات مرجعيتين صعبتين هما NTURGB+D و HDM05، فيما يتعلق بتحديد الأفعال الهيكلية.注:在阿拉伯语中,“placements”被翻译为“placements”可能不够准确,这里可以考虑将其翻译为“الإزاحات الزمنية”(temporal displacements),以保持专业性和准确性。因此,最终翻译如下:يشمل سلوك الإنسان حركة مشتركة للأجزاء المتحركة للجسم أو "الحركات" (gestures). يتم تمثيل الهيكل العظمي البشري بشكل حدسي كرسم بياني متفرق، حيث تكون المفاصل هي العقد والروابط الطبيعية بينها هي الأضلاع. استخدمت شبكات التلافيف الرسومية لتحديد السلوكيات من مقاطع الفيديو الهيكليّة. نقدم شبكة تلافيف رسومية قائمة على الأجزاء (PB-GCN) لهذه المهمة، مستوحاة من نماذج الأجزاء القابلة للتشوه (DPMs). نقسم رسم الهيكل العظمي إلى أربعة رسوم فرعية تشترك فيها المفاصل ونتعلم نموذج التعرف باستخدام شبكة تلافيف رسومية قائمة على الأجزاء. نوضح أن مثل هذا النموذج يحسن أداء التعرف مقارنة بنموذج يستخدم رسم الهيكل العظمي بأكمله. بدلاً من استخدام إحداثيات المفاصل ثلاثية الأبعاد كخصائص للعقد، نوضح أن استخدام الإحداثيات النسبية والإزاحات الزمنية يعزز الأداء. يحقق نموذجنا أفضل النتائج الحالية في مجموعتي بيانات مرجعيتين صعبتين هما NTURGB+D و HDM05، فيما يتعلق بتحديد السلوكيات الهيكليّة.