HyperAIHyperAI
منذ 8 أيام

CDTrans: محول عابر المجالات للتكيف بين المجالات غير المراقبة

Tongkun Xu, Weihua Chen, Pichao Wang, Fan Wang, Hao Li, Rong Jin
CDTrans: محول عابر المجالات للتكيف بين المجالات غير المراقبة
الملخص

يهدف التكيّف غير المُراقب بين المجالات (UDA) إلى نقل المعرفة المكتسبة من مجال مصدر مُعلّم إلى مجال مستقبلي مختلف غير مُعلّم. تركز معظم الطرق الحالية لـ UDA على تعلّم تمثيلات مميزة للمجال، سواء على مستوى المجال أو على مستوى الفئة، باستخدام أطر عمل تعتمد على الشبكات العصبية التلافيفية (CNNs). ويعتبر أحد المشكلات الأساسية في طرق UDA القائمة على مستوى الفئة هو إنتاج التسميات الوهمية (Pseudo Labels) للعينات في المجال المستقبلي، والتي غالبًا ما تكون مشوّشة جدًا لدرجة لا تسمح بالمحاذاة الدقيقة بين المجالين، مما يؤدي حتمًا إلى تدهور أداء UDA. وبفضل النجاح الكبير لنموذج Transformer في مهام متعددة، لاحظنا أن الانتباه المتقاطع (Cross-Attention) في Transformer يتمتع بقدرة عالية على التحمل تجاه أزواج الإدخال المشوّشة، مما يُحسّن من محاذاة الميزات. وبناءً عليه، نُقدّم في هذه الورقة استخدام Transformer لحل مهمة UDA الصعبة. بشكل محدد، لضمان إنتاج أزواج إدخال دقيقة، نصمم خوارزمية تسمية ثنائية الاتجاه تعتمد على المركز (Two-way Center-aware Labeling Algorithm) لإنتاج التسميات الوهمية للعينات في المجال المستقبلي. وبالإضافة إلى هذه التسميات، نقترح إطارًا ثلاثي الفروع يشارك في الوزن (Weight-sharing Triple-Branch Transformer Framework) لتطبيق الانتباه الذاتي (Self-Attention) على تعلّم الميزات من المجال المصدر والمستقبلي، والانتباه المتقاطع على محاذاة المجالات المصدرية والمستهدفة على التوالي. وتُعزز هذه البنية بشكل صريح الإطار لتعلّم تمثيلات مميزة لكل مجال (Domain-specific) وتمثيلات مُشتركة بين المجالات (Domain-invariant) في آن واحد. ونُسمّي الطريقة المقترحة بـ CDTrans (Transformer بين المجالات)، وهي تمثّل واحدة من أولى المحاولات لحل مهام UDA باستخدام حلّ نقي مبني على Transformer. وتُظهر النتائج التجريبية أن الطريقة المقترحة تحقق أفضل الأداء على مجموعات بيانات UDA العامة، مثل VisDA-2017 وDomainNet. يمكن الوصول إلى الكود والنماذج عبر الرابط: https://github.com/CDTrans/CDTrans.

CDTrans: محول عابر المجالات للتكيف بين المجالات غير المراقبة | أحدث الأوراق البحثية | HyperAI