تقطيع الحركات بالانتشار

الترقيم الزمني للإجراءات يُعد أمرًا بالغ الأهمية لفهم مقاطع الفيديو الطويلة. في السابق، اعتمد العمل السابق على هذا المهمة بشكل شائع على منهجية التحسين التكراري باستخدام نماذج متعددة المراحل. نقترح إطارًا جديدًا يستخدم نماذج التشتت التخلص من الضوضاء، والتي تتماشى مع نفس الروح الجوهرية لهذا التحسين التكراري. في هذا الإطار، تُولَّد تنبؤات الإجراءات تدريجيًا من الضوضاء العشوائية، مع أخذ ميزات الفيديو كمدخلات شرطية. ولتحسين نمذجة ثلاث خصائص بارزة للإجراءات البشرية، تشمل الأولوية المكانية، والغموض في الحدود، والاعتمادية الترابطية، قمنا بتصميم استراتيجية موحدة للإخفاء (Masking) للمدخلات الشرطية في إطارنا. أجرينا تجارب واسعة على ثلاث مجموعات بيانات معيارية، وهي GTEA و50Salads وBreakfast، وأظهرت النتائج أن الطريقة المقترحة تحقق أداءً أفضل أو مماثلاً لأفضل الطرق الحالية، مما يدل على فعالية النهج التوليدية في ترقيم الإجراءات.