تعلم تمثيل الحركة بدون إشراف باستخدام الكبسولات التلقائية

نقترح مُشفر الكبسولات الحركية التلقائي (MCAE)، والذي يعالج تحديًا رئيسيًا في تعلم تمثيلات الحركة بدون إشراف: ثبات التحويلات. يُمثّل MCAE الحركة في هرميّة ثنائية المستوى. في المستوى الأدنى، يتم تقسيم الإشارة الحركية المكانية-الزمنية إلى مقاطع قصيرة ومحليّة وخالية من الدلالات (semantic-agnostic). وفي المستوى الأعلى، يتم جمع هذه المقاطع لتشكيل أقسام كاملة ذات دلالات (semantic-aware). لكل من المستويين، نمثل الحركة بمجموعة من القوالب الثابتة للتحويلات التي تم تعلمها والتحولات الهندسية المقابلة باستخدام كبسولات مشفرة ذات تصميم جديد. هذا يؤدي إلى ترميز قوي وكفء لتغيرات الزاوية البصرية. تم تقييم MCAE على مجموعة بيانات حركة جديدة تسمى Trajectory20 وعلى مجموعات بيانات مختلفة للحركة البشرية القائمة على الهياكل العظمية في العالم الحقيقي. ومن الجدير بالذكر أنه حقق نتائج أفضل من النماذج الأساسية على Trajectory20 بعدد أقل بكثير من المعلمات وأداءً رائدًا في مهمة التعرف على الحركة القائمة على الهيكل العظمي بدون إشراف.