توسيع الشبكات العميقة الواسعة للتقسيم الشامل

أظهرت الشبكات العميقة الواسعة (Wide-ResNets)، وهي صيغة مبسطة ولكن واسعة من الشبكات العميقة (ResNets) التي تُبنى عن طريق تجميع عدد قليل من كتل التراكيب العميقة (residual blocks) ذات أعداد كبيرة من القنوات، أداءً متميزًا في مهام التنبؤ الكثيف المتعددة. ومع ذلك، منذ ظهورها، لم تشهد بنية Wide-ResNet تطورًا ملحوظًا على مر السنين. في هذا العمل، نعيد النظر في تصميم بنية Wide-ResNet لمعالجة مهمة التجزئة الشاملة (panoptic segmentation) الصعبة حديثًا، التي تهدف إلى دمج التجزئة المعنى (semantic segmentation) والتجزئة الواقعيّة (instance segmentation). تم الحصول على نموذج أساسي من خلال دمج تقنيتي التقليل والتحفيز (Squeeze-and-Excitation) والانسيابية القابلة للتبديل (Switchable Atrous Convolution) اللتين تُعدان بسيطتين وفعّالتين في شبكة Wide-ResNets. كما تم توسيع قدرة الشبكة أو تقليلها عبر تعديل العرض (أي حجم القنوات) والعمق (أي عدد الطبقات)، مما أدى إلى إنشاء عائلة من الشبكات المعروفة بـ SWideRNets (وهي اختصار لـ Scaling Wide Residual Networks). ونُظهر أن هذه الطريقة البسيطة للتوسيع، مدعومة ببحث شبكي (grid search)، تُمكّن من تحديد عدة نماذج SWideRNets تُحدث تقدمًا كبيرًا في الأداء المُتفوّق على بيانات التجزئة الشاملة، سواء في نطاق النماذج السريعة أو النماذج القوية.