تقسيم الإجراءات مع التكيف الزمني للنطاق المشترك التلقائي

رغم التقدم الأخير في تقنيات تقسيم الأفعال المُراقبة بالكامل، لا يزال الأداء غير راضٍ تمامًا. إحدى التحديات الرئيسية تكمن في مشكلة التغيرات المكانية الزمنية (مثل أن يُنفّذ نفس النشاط بطرق مختلفة من قبل أشخاص مختلفين). ولذلك، نستغل مقاطع الفيديو غير المُعلّمة للتعامل مع هذه المشكلة من خلال إعادة صياغة مهمة تقسيم الأفعال كمشكلة متعددة المجالات، حيث ينشأ تباين بين المجالات نتيجة للتغيرات المكانية الزمنية. ولتقليل هذا التباين، نقترح طريقة التكيف المكانية الزمنية ذاتية التعلّم (SSTDA)، والتي تتضمّن مهام مساعدة ذاتية التعلّم اثنتين (تنبؤ ثنائي ومهمة تنبؤ تسلسلي للمجال) بهدف محاذاة فضاءات الميزات عبر المجالات بشكل مشترك، مع احتواء هذه الفضاءات على ديناميكيات زمنية محلية وعالمية، مما يؤدي إلى أداء أفضل مقارنةً بطرق التكيف بين المجالات (DA) الأخرى. وقد أظهرت SSTDA تفوقًا كبيرًا على أحدث الأساليب المُعتمدة في ثلاث مجموعات بيانات صعبة (GTEA، 50Salads، وBreakfast)، حيث ارتفع مؤشر F1@25 من 59.6% إلى 69.1% على Breakfast، ومن 73.4% إلى 81.5% على 50Salads، ومن 83.6% إلى 89.1% على GTEA. كما أن الأداء المماثل يمكن تحقيقه باستخدام فقط 65% من بيانات التدريب المُعلّمة، مما يُظهر فعالية التكيّف مع مقاطع الفيديو الهدف غير المُعلّمة عبر التباينات المختلفة. يمكن الوصول إلى الكود المصدري عبر الرابط: https://github.com/cmhungsteve/SSTDA.