استغلال البنية المجاورة الذاتية للتكيف بين المجالات دون الحاجة إلى مصدر

تهدف التكييف النطقي (DA) إلى تخفيف الانزياح النطقي بين المجال المصدر والمجال الهدف. ويتطلب معظم مناهج التكييف النطقي الوصول إلى بيانات المصدر، لكن غالبًا ما يكون ذلك مستحيلًا (مثلًا بسبب قضايا الخصوصية أو الملكية الفكرية). في هذا البحث، نتناول مشكلة التكييف النطقي بدون مصدر (SFDA)، حيث يتم تكييف النموذج المُدرَّب مسبقًا على المجال المصدر ليُطبَّق على المجال الهدف دون وجود بيانات المصدر. يعتمد منهجنا على ملاحظة أن بيانات الهدف، التي قد لا تتطابق بعد مع فئة التصنيف الخاصة بالمجال المصدر، لا تزال تشكل مجموعات واضحة. نقوم بتوثيق هذه البنية الداخلية من خلال تعريف الترابط المحلي لبيانات الهدف، وندعو إلى الاتساق في التصنيف بين البيانات ذات الترابط المحلي العالي. نلاحظ أن الترابط الأعلى ينبغي أن يُمنح للجيران المتبادلين، ونُقدّم خسارة ت.REGULARIZATION ذاتية لتقليل الأثر السلبي للجيران الضوضائيين. علاوةً على ذلك، ولجمع المعلومات بسياق أوسع، نأخذ بعين الاعتبار جيرانًا موسّعين ذات قيم ترابط صغيرة. ونُثبت في النتائج التجريبية أن البنية الطبيعية لسمات الهدف تمثل مصدرًا مهمًا للمعلومات في التكييف النطقي. ونُظهر أن هذه البنية المحلية يمكن التقاطها بكفاءة من خلال أخذ الجيران المحليين، والجيران المتبادلين، والجيران الموسّعين بعين الاعتبار. وأخيرًا، نحقق أداءً من الدرجة الأولى على عدة مجموعات بيانات للتصنيف ثنائي الأبعاد (2D) والبيانات النقطية ثلاثية الأبعاد (3D). يمكن الوصول إلى الكود عبر الرابط: https://github.com/Albert0147/SFDA_neighbors.