تطابق التوزيع للتعلم متعدد المهام غير المتجانسة: دراسة واسعة النطاق على الوجوه

ظهر التعلم متعدد المهام (Multi-Task Learning) كمنهجية يتم فيها تعلم مهام متعددة بشكل مشترك بواسطة خوارزمية تعلم مشتركة، مثل الشبكة العصبية العميقة (DNN). يعتمد التعلم متعدد المهام (MTL) على الافتراض بأن المهام المعنية مرتبطة؛ وبالتالي يستغل المعرفة المشتركة لتحسين الأداء في كل مهمة منفردة. عادةً ما تعتبر المهام متجانسة، أي أنها تشير إلى نوع واحد من المشكلات. بالإضافة إلى ذلك، يعتمد MTL عادةً على شروحات صحيحة جزئياً أو بالكامل بين المهام. في هذا العمل، نتعامل مع التعلم متعدد المهام غير المتجانس (heterogeneous MTL)، حيث نعالج في الوقت نفسه مشكلات الكشف والتصنيف والتقييم. نستكشف العلاقة بين المهام كوسيلة للتدريب المشترك للمهام التي تحتوي على شروحات قليلة أو حتى غير متقاطعة بطريقة ضعيفة الإشراف. يتم تقديم العلاقة بين المهام في MTL إما بشكل صريح عبر المعلومات السابقة التي توفرها الخبراء، أو من خلال دراسات تعتمد على البيانات.نقترح نهجًا جديدًا لتوزيع التطابق، حيث يمكن تبادل المعرفة بين المهام من خلال مطابقة توزيعات التنبؤ الخاصة بها. بناءً على هذا النهج، نقوم ببناء إطار FaceBehaviorNet، وهو أول إطار لتحليل الوجه على نطاق واسع من خلال تعلم جميع مهام السلوك الوجهي بشكل مشترك. نطور دراسات حالة لـ: i) تقدير العواطف المستمرة وكشف الوحدات الفعلية وتعرف العواطف الأساسية؛ ii) كشف الصفات وتعرف الوجه.نوضح أن التدريب المشترك عبر العلاقة بين المهام يخفف من النقل السلبي. بما أن FaceBehaviorNet يتعلم الخصائص التي تشتمل على جميع جوانب السلوك الوجهي، فإننا نجري تعلمًا بدون أمثلة أو بقليل منها (zero-/few-shot learning) لأداء مهام تتخطى تلك التي تم تدريبه عليها، مثل التعرف على العواطف المعقدة. عن طريق إجراء دراسة تجريبية كبيرة للغاية باستخدام 10 قواعد بيانات، نوضح أن نهجنا يتفوق بمargins كبيرة على أحدث التقنيات في جميع المهام وفي جميع قواعد البيانات، حتى تلك التي لم يتم استخدامها في تدريبه.