HyperAIHyperAI
منذ 17 أيام

التعلم الذاتي المُتَّفَق عليه المُتَفَرِّق للفهم المرئي

Yasar Abbas Ur Rehman, Yan Gao, Jiajun Shen, Pedro Porto Buarque de Gusmao, Nicholas Lane
التعلم الذاتي المُتَّفَق عليه المُتَفَرِّق للفهم المرئي
الملخص

أدى الانتشار الواسع للأجهزة المحمولة المزودة بكاميرات إلى إنتاج كميات ضخمة من البيانات الفيديو غير المُعلَّمة على الحافة. وعلى الرغم من اقتراح العديد من الأساليب التلقائية التعلم (SSL) لاستخلاص التمثيلات الزمانية-المكانية الكامنة فيها لتدريب المهام المحددة، إلا أن التحديات العملية مثل مخاوف الخصوصية وتكاليف الاتصال تمنع تطبيق SSL على نطاق واسع. ولتخفيف هذه المشكلات، نقترح استخدام التعلم المُتَّفَق عليه (FL) في مهمة التعلم التلقائي للفيديو. في هذه الدراسة، نقيّم أداء أحدث التقنيات المتطورة (SOTA) في مجال التعلم التلقائي للفيديو، ونحدد نقاط ضعفها عند دمجها في بيئة تعلم مُتَّفَق عليه على نطاق واسع، ومحاكاة باستخدام مجموعة بيانات Kinetics-400. ثم نقترح إطارًا جديدًا للتعلم التلقائي المُتَّفَق عليه للفيديو، يُدعى FedVSSL، يدمج استراتيجيات تجميع مختلفة وتحديثًا جزئيًا للوزن. أظهرت التجارب الواسعة فعالية وجدوى FedVSSL، حيث تفوق على أفضل النماذج المركزية في المهمة التالية للبحث بنسبة 6.66% على UCF-101 و5.13% على HMDB-51.