HyperAIHyperAI
منذ 8 أيام

كودا: التكيف المتسلسل التوجيهي عبر المجالات مع تعديل موجه بصري يراعي شدة الحالة

Ziyang Gong, Fuhao Li, Yupeng Deng, Deblina Bhattacharjee, Xianzheng Ma, Xiangwei Zhu, Zhenming Ji
كودا: التكيف المتسلسل التوجيهي عبر المجالات مع تعديل موجه بصري يراعي شدة الحالة
الملخص

يهدف التكييف غير المُراقب للنطاق (UDA) إلى تكييف النماذج من نطاقات مصدر مُعلمة إلى نطاقات مستهدفة غير مُعلمة. ومع أن هذه النماذج تُظهر أداءً ضعيفًا عند التكييف مع المشاهد المُعَرَّضة للعوائق، نظرًا لعدم توفر إرشادات توجيهية، مما يؤدي إلى تجاهل النماذج الفروقات داخل جميع المشاهد الصعبة. ولحل هذه المشكلة، نقترح منهجية CoDA التي تُوجِّه النماذج لتمييز الفروقات، والتركيز عليها، والتعلم منها على مستويي المشهد والصورة. بشكل محدد، تتكوّن CoDA من استراتيجية سلسلة النطاقات (CoD) وآلية تكييف النص المرئي المُدرك للشدة (SAVPT). تركز استراتيجية CoD على إرشادات على مستوى المشهد، حيث تقوم بتقسيم جميع المشاهد الصعبة إلى مشاهد سهلة وصعبة، وتوجيه النماذج لتكييفها من النطاق المصدري إلى النطاقات السهلة باستخدام صور من المشاهد السهلة، ثم إلى النطاقات الصعبة باستخدام صور من المشاهد الصعبة، مما يُسهم في بناء أساس متين للتكييف الشامل. وبما أن هذا الأساس مُعدٌّ، نستخدم SAVPT للدخول في تفاصيل أكثر على مستوى الصورة لتعزيز الأداء. وتتميز SAVPT بمعيار جديد يُسمى "الشدة"، الذي يُقسّم صور المشاهد الصعبة إلى صور ذات شدة منخفضة وصورة ذات شدة عالية. ثم تُوجِّه الشدة النصوص المرئية والمحولات، وتُوجِّه النماذج لتركيزها على السمات الموحّدة حسب الشدة بدلًا من السمات الخاصة بالمشهد، دون إضافة تعقيد على هيكل النموذج. تحقق CoDA أداءً متفوّقًا على المعايير الشائعة في جميع المشاهد الصعبة. وبشكل ملحوظ، تتفوّق CoDA على الطرق الحالية بنسبة 4.6% و10.3% في مقياس mIoU على معايير Foggy Driving وFoggy Zurich على التوالي. يمكن الاطلاع على الكود الخاص بنا عبر الرابط: https://github.com/Cuzyoung/CoDA

كودا: التكيف المتسلسل التوجيهي عبر المجالات مع تعديل موجه بصري يراعي شدة الحالة | أحدث الأوراق البحثية | HyperAI