DeepJDOT: النقل الأمثل للتوزيع المشترك العمق للتكيف بين المجالات دون إشراف

في مجال رؤية الحاسوب، غالباً ما يُواجه الباحثون مشكلة التحولات النمطية (domain shifts)، والتي تحدث عندما يتم تطبيق تصنيف تم تدريبه على مجموعة بيانات مصدر على بيانات الهدف التي تشترك في خصائص متشابهة (مثل نفس الفئات) ولكنها تختلف أيضاً في بنية البيانات الكامنة (مثل ظروف الاستحواذ المختلفة). في مثل هذه الحالة، ستعاني النموذج من أداء ضعيف على البيانات الجديدة، نظراً لاختصاصه في التعرف على العلامات المرئية الخاصة بمجال المصدر. في هذا البحث، نستكشف حلاً يُسمى DeepJDOT للتعامل مع هذه المشكلة: من خلال قياس الاختلاف بين التمثيلات العميقة المشتركة والتصنيفات المستندة إلى النقل الأمثل (optimal transport)، لا نتعلم فقط تمثيلات بيانات جديدة متناسقة بين مجال المصدر ومجال الهدف، بل نحافظ أيضًا بشكل متزامن على المعلومات المميزة المستخدمة بواسطة المصنف. قدمنا DeepJDOT إلى سلسلة من مهام التعرف البصري، حيث أظهرت أداؤه أفضل من أفضل الأساليب الحديثة للتكيف العميق بين المجالات.