Command Palette
Search for a command to run...
توسيع المجال غير المشرف للتصنيف البصري
توسيع المجال غير المشرف للتصنيف البصري
JIE WANG* KAIBIN TIAN* DAYONG DING GANG YANG XIRONG LI†
الملخص
توسيع تصنيف الصور إلى مجال جديد دون الحاجة إلى تسميات إضافية كان محل اهتمام طويل الأمد للذكاء المتعدد الوسائط. في السابق، تم التعامل مع هذا التحدي من خلال التكيف غير المشرف بين المجالات (UDA). بالنظر إلى البيانات المصنفة من مجال المصدر والبيانات غير المصنفة من مجال الهدف، يسعى UDA للحصول على تمثيل عميق يكون مميزًا ومستقرًا بين المجالات. بينما يركز UDA على مجال الهدف، نعتقد أن الأداء في كل من مجال المصدر ومجال الهدف مهم، حيث أن مصدر مثال الاختبار غير معروف في الممارسة العملية. في هذه الورقة البحثية، نوسع نطاق UDA من خلال اقتراح مهمة جديدة تُسمى التكيف غير المشرف لتوسيع المجال (UDE)، والتي تهدف إلى تكييف نموذج عميق لمجال الهدف باستخدام بياناته غير المصنفة، مع الحفاظ على أداء النموذج في مجال المصدر. نقترح طريقة توسيع المجال عن طريق تقليص المعرفة (KDDE) كطريقة عامة للمهمة UDE. يمكن تنفيذ وحدة التكيف بين المجالات الخاصة بها بأي نموذج موجود. قمنا بتطوير آلية تعلم تعتمد على تقليص المعرفة، مما يمكّن KDDE من تحسين هدف واحد يتم فيه معاملة كل من مجال المصدر ومجال الهدف بشكل متساوٍ. أظهرت التجارب الواسعة على محركي الاختبار الرئيسيين Office-Home و DomainNet أن KDDE يتفوق بشكل ملحوظ على أربع أسس تنافسية هي DDC و DANN و DAAN و CDAN لكل من مهمتي UDA و UDE. كما كشفت دراستنا أن النماذج الحالية لـ UDA تحسن أدائها في مجال الهدف على حساب خسارة واضحة في الأداء بمجال المصدر.