HyperAIHyperAI
منذ 17 أيام

شبكة تبادلية ثنائية الرسوم البيانية للتصنيف الدلالي

Li Zhang, Xiangtai Li, Anurag Arnab, Kuiyuan Yang, Yunhai Tong, Philip H.S. Torr
شبكة تبادلية ثنائية الرسوم البيانية للتصنيف الدلالي
الملخص

إن استغلال المعلومات السياقية على مدى طويل يعد عنصراً أساسياً في المهام التي تتطلب التنبؤ بدقة لكل بكسل، مثل التجزئة الدلالية. وعلى عكس الدراسات السابقة التي تعتمد على دمج الميزات متعددة المقياس أو التحويلات الموسعة (dilated convolutions)، نقترح شبكة جديدة تعتمد على التوليف الرسومي (GCN) لمعالجة هذه المشكلة. تُعدّ شبكة التوليف الرسومي المزدوجة (DGCNet) التي نقترحها قادرة على نمذجة السياق العالمي للميزة المدخلة من خلال نمذجة رسومتين متعامدتين ضمن إطار موحد. يُعالج المكون الأول العلاقات الفضائية بين البكسلات في الصورة، بينما يعالج المكون الثاني الترابطات المتبادلة عبر أبعاد القنوات في خريطة الميزات الخاصة بالشبكة. ويتم ذلك بكفاءة من خلال إسقاط الميزة إلى فضاء جديد أصغر أبعاداً، حيث يمكن نمذجة جميع التفاعلات الثنائية، قبل إعادة إسقاطها إلى الفضاء الأصلي. تقدم طريقة بسيطة هذه فوائد كبيرة مقارنة بقاعدة قوية، وتحقيق نتائج رائدة على كلا مجموعتي البيانات Cityscapes (82.0% متوسط IoU) وPascal Context (53.7% متوسط IoU). تم إتاحة الشفرة والنماذج لتشجيع أي أبحاث لاحقة (\url{https://github.com/lxtGH/GALD-DGCNet}).