نقل إلى تخطيطات العالم الحقيقي: إطار عميق الوعي للتكيف مع المشاهد

التفتيش المناظري من خلال التكيف النمطي غير المشرف (UDA) يمكّن نقل المعرفة المستقاة من البيانات المصطنعة المصدر إلى البيانات الحقيقية الهدف، مما يقلل بشكل كبير الحاجة إلى التسميات البكسلية اليدوية في المجال الهدف. لتسهيل تعلم الخصائص الثابتة بين المجالات، تعتمد الأساليب الموجودة عادةً على مزج البيانات من كلا المجالين المصدر والهدف عن طريق نسخ ولصق البكسلات ببساطة. ومع ذلك، فإن هذه الأساليب البسيطة غالبًا ما تكون غير مثلى لأنها لا تأخذ في الاعتبار مدى مطابقة التخطيطات المختلطة للسيناريوهات الحقيقية. السيناريوهات الحقيقية لها تخطيط داخلي. نلاحظ أن الفئات الدلالية، مثل الأرصفة والمباني والسماوات، تظهر توزيعات عمق نسبية ثابتة ويمكن تمييزها بوضوح في خريطة العمق. بناءً على هذا الملاحظة، نقترح إطارًا يعمل بالوعي بالعمق لاستخدام تقدير العمق بشكل صريح في مزج الفئات وتسهيل مهمتين متكاملتين، وهما التفتيش المناظري وتعلم العمق بطريقة شاملة. وبشكل خاص، يحتوي الإطار على مرشح سياقي موجه بالعمق (DCF) للزيادة الصورية للبيانات ومحودد متعدد للمهمتين لتعلم السياق. يعمل DCF على تحاكي التخطيطات الحقيقية، بينما يقوم محودد المهام المتعددة بتجميع الخصائص المكملة بين المهمتين بشكل متكيف أكثر. بالإضافة إلى ذلك، يجب الإشارة إلى أن العديد من قواعد البيانات العامة لا توفر تسميات العمق. لذلك، نعتمد شبكة تقدير العمق الجاهزة لتوليد العمق الوهمي (pseudo depth). أظهرت التجارب الواسعة أن الأساليب المقترحة لدينا، حتى مع استخدام العمق الوهمي، حققت أداءً تنافسيًا على مقعدين اختبار شائعين: 77.7 mIoU من GTA إلى Cityscapes و69.3 mIoU من Synthia إلى Cityscapes.注释:mIoU 是 "mean Intersection over Union" 的缩写,在阿拉伯语中通常直接使用英文缩写。如果需要进一步解释,可以在第一次出现时添加注释。例如:“77.7 mIoU (متوسط تقاطع فوق الاتحاد)” 和 “69.3 mIoU (متوسط تقاطع فوق الاتحاد)”。