التكامل العالمي ثم التوزيع المحلي في الشبكات التلافيفية الكاملة

لقد تم إثباته على نطاق واسع أن نمذجة الاعتماديات طويلة المدى في الشبكات التلافيفية الكاملة (FCNs) من خلال وحدات التجميع العالمي أمر بالغ الأهمية لمهمات فهم المشاهد المعقدة مثل التجزئة الدلالية واكتشاف الكائنات. ومع ذلك، فإن التجميع العالمي غالبًا ما يهيمن عليه ميزات الأنماط الكبيرة، ويؤدي إلى تمويه مفرط في المناطق التي تحتوي على أنماط صغيرة (مثل الحدود والكائنات الصغيرة). لحل هذه المشكلة، نقترح استخدام \emph{التجميع العالمي} أولاً، ثم \emph{التوزيع المحلي}، وهو ما يُسمى GALD، حيث تُستخدم الاعتماديات طويلة المدى بشكل أكثر ثقة داخل مناطق الأنماط الكبيرة، والعكس صحيح. ويتم تقدير حجم كل نمط في كل موقع داخل الشبكة كخريطة قنوات محددة لكل قناة. وتعتبر GALD قابلة للتدريب من الطرف إلى الطرف، ويمكن دمجها بسهولة في الشبكات التلافيفية الكاملة الحالية التي تستخدم وحدات تجميع عالمي مختلف، مما يُمكنها من تحسين الأداء بشكل متسق في مجموعة واسعة من مهام الرؤية، بما في ذلك أحدث الأساليب في اكتشاف الكائنات والتفصيل الحاد (instance segmentation). وبشكل خاص، حققت GALD أداءً جديدًا على مستوى الحالة (state-of-the-art) في مهام التجزئة الدلالية على مجموعة بيانات Cityscapes، مع تحقيق متوسط دقة التداخل (mIoU) البالغ 83.3٪. يمكن الوصول إلى الكود من خلال: \url{https://github.com/lxtGH/GALD-Net}