Command Palette
Search for a command to run...
LSTM الزماني المكاني مع أبواب الثقة للتعرف على الحركات البشرية ثلاثية الأبعاد
LSTM الزماني المكاني مع أبواب الثقة للتعرف على الحركات البشرية ثلاثية الأبعاد
Liu Jun Shahroudy Amir Xu Dong Wang Gang
الملخص
تمثيل الحركات ثلاثية الأبعاد – والذي يعتمد على تحليل الحركات البشرية بناءً على بيانات الهيكل العظمي ثلاثي الأبعاد – أصبح شائعًا مؤخرًا بفضل ميزاته مثل الإيجاز، والمتانة، والتمثيل المستقل عن الزاوية المرئية. وقد اقترح العديد من الدراسات الحديثة تطوير أساليب تعلم تعتمد على الشبكات العصبية التكرارية (RNN) لتمثيل الاعتماد المنهجي في المجال الزمني. وفي هذا البحث، نوسع هذه الفكرة لتشمل المجالين المكاني والزمني معًا، بهدف تحليل المصادر المخفية للمعلومات المرتبطة بالحركة داخل البيانات المدخلة على نحو متزامن في كلا المجالين. مستوحين من البنية الرسومية لهيكل العظم البشري، نقترح طريقة جديدة قائمة على هيكل شجري لاستكشاف البيانات بشكل أكثر كفاءة. ولمعالجة الضوضاء والانسداد التي تظهر في بيانات الهيكل العظمي ثلاثي الأبعاد، نُدخل آلية تمرير (gating) جديدة داخل نموذج LSTM، تُمكّن النموذج من تعلّم موثوقية البيانات المدخلة المتسلسلة، وتعديل تأثيرها على تحديث المعلومات السياقية طويلة المدى المخزنة في الخلية الذاكرةية. وقد أظهرت النتائج أداءً متميزًا على مستوى الحد الأقصى (state-of-the-art) في أربع مجموعات بيانات معيارية صعبة لتحليل الحركات البشرية ثلاثية الأبعاد.