التكيف الحسي للنطاق في الفيديو باستخدام التدريب المُقنَّع والتدريب الذاتي التعاوني

في هذه الدراسة، نتناول مشكلة التكيّف غير المُراقب بين المجالات (UDA) للتعرف على الحركات في الفيديو. يعتمد نهجنا، الذي نسميه UNITE، على استخدام نموذج معلم صور لتكيف نموذج طالب فيديو مع المجال الهدف. يبدأ UNITE بتدريب مسبق ذاتي التوجيه لتعزيز تعلم الميزات التمييزية على مقاطع الفيديو في المجال الهدف، باستخدام دالة تبديد مُقنّع موجهة بالنموذج المعلم. ثم نُجري عملية تدريب ذاتي على البيانات الهدف المُقنّعة، باستخدام نموذج الطالب فيديو والنموذج المعلم الصور معًا لإنتاج تسميات وهمية محسّنة لمقاطع الفيديو الهدف غير المُعلّمة. تُظهر عملية التدريب الذاتي نجاحها في استغلال المزايا المتميزة لكلا النموذجين لتحقيق أداء قوي في النقل بين المجالات. وقد قمنا بتقييم منهجنا على عدة معايير معيارية لتكيّف مجالات الفيديو، ولاحظنا تحسنًا ملحوظًا مقارنة بالنتائج المبلغ عنها سابقًا.