التفكيك الفعلي مع التكيّف الزمني المختلط

تتمثل التقدم الرئيسي في تقسيم الإجراءات في البيانات المُعلَّمة بكثافة لتعلم مُوجَّه بالكامل. وبما أن التصنيف اليدوي للإجراءات على مستوى الإطارات هو عملية مُستهلكة للوقت وصعبة، نقترح استغلال مقاطع الفيديو الإضافية غير المُعلَّمة، التي تُعدّ أسهل في الحصول عليها، من خلال تشكيل هذه المشكلة كمشكلة تكييف مجال (DA). وعلى الرغم من الطرق المختلفة لتكييف المجال التي تم اقتراحها في السنوات الأخيرة، إلا أن معظمها تم تطويره فقط في الاتجاه المكاني. لذلك، نقترح طريقة تكييف مجالي زمني مختلط (MTDA) لمحاذاة فضاءات الميزات المُدمَجة على مستوى الإطار والفيديو معًا عبر المجالات، بالإضافة إلى دمجها مع آلية الانتباه إلى المجال لتركيز المحاذاة على ميزات الإطار ذات الفرق المجالي الأكبر، مما يؤدي إلى تكييف مجالي أكثر فعالية. وأخيرًا، قمنا بتقييم الطرق المقترحة على ثلاث مجموعات بيانات صعبة (GTEA و50Salads وBreakfast)، وتم التحقق من أن MTDA تتفوق على أحدث الطرق المُعلَّمة في جميع المجموعات الثلاث بفارق كبير (مثل زيادة بنسبة 6.4% في F1@50 و6.8% في درجة التحرير لبيانات GTEA).