تطور الخسائر لتعلم تمثيل الفيديو بدون إشراف

نقدم طريقة جديدة لتعلم تمثيلات الفيديو من بيانات فيديو غير مصنفة على نطاق واسع. المثالي هو أن يكون هذا التمثيل عامًا وقابلًا للنقل، قابلًا للاستخدام المباشر في مهام جديدة مثل التعرف على الأنشطة والتعلم بقليل أو بدون أمثلة. نصيغ تعلم التمثيلات دون إشراف كمشكلة تعلم متعددة الوسائط ومتعددة المهام، حيث يتم مشاركة التمثيلات عبر وسائط مختلفة عن طريق التقطير. بالإضافة إلى ذلك، نقدم مفهوم تطور دالة الخسارة باستخدام خوارزمية البحث التطورية لاكتشاف تركيبة مثلى من دوال الخسارة التي تلتقط العديد من المهام (الذاتية الإشراف) والوسائط بشكل آلي. ثالثًا، نقترح مؤشر تقييم تمثيلي غير مشرف يستخدم تقابُل التوزيع مع مجموعة بيانات كبيرة غير مصنفة كقيد أولي، استنادًا إلى قانون زيبف (Zipf's law). ينتج هذا القيد غير المشرف، الذي لا يوجهه أي تصنيف، نتائج مشابهة لتلك النتائج التي تنتجها الطرق شبه المشرف عليها والمحددة للمهمة. يؤدي التعلم التمثيلي غير المشرف المقترح إلى شبكة واحدة RGB وتتفوق على الطرق السابقة. ومن الجدير بالذكر أنها أيضًا أكثر فعالية من عدة طرق تعتمد على العلامات (مثل ImageNet)، باستثناء قواعد البيانات الفيديو الكبيرة والمصنفة بالكامل.