تمييز أفعال الإنسان المستقلة عن الرؤية باستخدام توزيعات التوقيعات الثلاثية الأبعاد
في هذه الورقة، نقدم نهجًا جديدًا لتمييز الحركات البشرية باستخدام مخططات توزيع مواقع المفاصل ثلاثية الأبعاد (HOJ3D) كتمثيل مكثف للوضعيات. نستخرج مواقع المفاصل العظمية ثلاثية الأبعاد من خرائط العمق الخاصة بـ Kinect باستخدام طريقة شوتون وآخرون [6]. يتم إعادة ترسيم مخططات HOJ3D المُحتسبة من تسلسلات العمق الخاصة بالحركة باستخدام التحليل التمييزي الخطي (LDA)، ثم تُجمَّع إلى k كلمة بصرية تمثل الوضعيات النموذجية للحركات. ويُنمذج التغير الزمني لهذه الكلمات البصرية باستخدام نماذج ماركوف المخفية المنفصلة (HMMs). بالإضافة إلى ذلك، وبسبب تصميم نظام الإحداثيات الكروية لدينا، بالإضافة إلى تقدير عظمي ثلاثي الأبعاد المُتماسك المستمد من Kinect، تُظهر طريقة العمل لدينا استقرارًا كبيرًا تجاه التغيرات في الزاوية المرئية على مجموعة بيانات الحركات ثلاثية الأبعاد الخاصة بنا. وتتكون مجموعة بياناتنا من 200 تسلسلاً ثلاثي الأبعاد لـ 10 أنشطة داخلية أُنجزت من قبل 10 أفراد من زوايا مختلفة. وتكمن ميزة طريقة العمل في قدرتها على العمل في الزمن الفعلي، كما تحقق نتائج متفوقة على مجموعة بيانات الحركات ثلاثية الأبعاد الصعبة. وقد اختبرنا خوارزميتنا أيضًا على مجموعة بيانات MSR Action 3D، حيث تفوقت خوارزميتنا على طريقة لي وآخرون [25] في معظم الحالات.