استخراج البنية الزمنية للكشف عن الإجراءات المُدرَّبة بشكل ضعيف

على عكس مشكلة كشف الحركات ذات التدريب الكامل التي تعتمد على تسميات مكلفة على مستوى الإطارات، فإن كشف الحركات المُدرَّبة بشكل ضعيف (WSAD) يحتاج فقط إلى تسميات على مستوى الفيديو، مما يجعلها أكثر ملاءمة للتطبيقات الواقعية. تعتمد الطرق الحالية لـ WSAD على كشف حالات الحركات من خلال تقييم كل قطعة فيديو (مجموعة من الإطارات) بشكل منفصل. ومع ذلك، تفشل معظم هذه الطرق في نمذجة العلاقات الزمنية بين قطع الفيديو، ولا تستطيع تمثيل حالات الحركات التي تمتلك بنية زمنية خفية بشكل فعّال. ولتخفيف هذه المشكلة في WSAD، نقترح منهجية استخراج البنية الزمنية (TSM). في TSM، تُنمذج كل حالة حركة كعملية متعددة المراحل، ويتم استغلال التطور الزمني للمرحلات داخل حالة الحركة، أي البنية الزمنية. في الوقت نفسه، تُنمذج الخلفية الزمنية للفيديو بواسطة مرحلة خلفية، والتي تفصل بين حالات الحركات المختلفة في الفيديو غير المُقَصَّر. ضمن هذا الإطار، تُستخدم مرشحات المراحل لحساب درجات الثقة لوجود مراحل الحركة في كل قطعة. وبما أن التسميات على مستوى الإطارات غير متوفرة في مهمة WSAD، فإن مرشحات المراحل لا يمكن تدريبها مباشرة. ولحل هذه التحديات، نعامل كل مرحلة لقطعة كمتغير مخفي. نستخدم درجات الثقة للقطع من كل مرشح مرحلة لبناء جدول، ونحدد المتغيرات المخفية، أي مراحل القطع، من خلال اكتشاف أقصى مسار دوري (maximal circulant path) عبر هذا الجدول. أظهرت التجارب التي أُجريت على ثلاث مجموعات بيانات معيارية أداءً من الدرجة الأولى في مجال TSM.