ترجمة الصور متعددة المكونات للعمق العام بين المجالات

التكيف بين المجالات (DA) والعمومية بين المجالات (DG) هما طريقتان مرتبطتان بشكل وثيق ويهمان كلاهما مهمة تعيين العلامات لمجموعة بيانات غير مصنفة. الفرق الوحيد بين هذين النهجين هو أن DA يمكنها الوصول إلى البيانات المستهدفة خلال مرحلة التدريب، بينما تكون البيانات المستهدفة غير معروفة تمامًا خلال مرحلة التدريب في DG. تعتبر مهمة DG تحديًا نظرًا لعدم وجود أي معرفة سابقة بالعينات المستهدفة. إذا تم تطبيق طرق DA مباشرة على DG من خلال استبعاد البيانات المستهدفة من التدريب ببساطة، فستكون الأداء ضعيفًا بالنسبة للمهمة المعطاة. في هذا البحث، نواجه تحدي العمومية بين المجالات بطريقتين. في نهجنا الأول، نقترح بنية جديدة للعمومية العميقة بين المجالات باستخدام البيانات المصنعة التي ينتجها شبكة المولد المضادة (GAN). يتم تقليل الاختلاف بين الصور المنتجة والصور المصنعة باستخدام مقاييس الاختلاف الحالية بين المجالات مثل الاختلاف المتوسط الأقصى أو تنسيق الارتباط. في نهجنا الثاني، نقدم بروتوكولًا لتطبيق طرق DA على سيناريو DG من خلال استبعاد البيانات المستهدفة من مرحلة التدريب، تقسيم البيانات المصدر إلى أجزاء للتدريب والتحقق، واعتبار بيانات التحقق كبيانات مستهدفة لـ DA. نقوم بإجراء تجارب واسعة النطاق على أربع مجموعات بيانات مرجعية عبر مجالات مختلفة. تشير نتائج التجارب إلى أن النموذج المقترح لدينا يتفوق على أفضل الطرق الحالية لـ DG.