Command Palette
Search for a command to run...
إعادة التفكير في التحويل الشبكي النافذ لتقسيم الصور المعنوية
إعادة التفكير في التحويل الشبكي النافذ لتقسيم الصور المعنوية
Chen Liang-Chieh Papandreou George Schroff Florian Adam Hartwig
الملخص
في هذه الدراسة، نعيد النظر في التحويل المتباعد (atrous convolution)، وهو أداة قوية تُستخدم لضبط مجال تأثير المرشح (field-of-view) بشكل صريح، وكذلك لضبط دقة الاستجابات المميزة التي تُحسب بواسطة الشبكات العصبية التلافيفية العميقة (Deep Convolutional Neural Networks)، وذلك في تطبيق تقسيم الصور الدلالي (semantic image segmentation). ولمعالجة مشكلة تقسيم الكائنات على مقاييس متعددة، نصمم وحدات تستخدم التحويل المتباعد بشكل متسلسل أو متوازٍ لالتقاط السياق متعدد المقاييس من خلال اعتماد معدلات متباعدة متعددة. علاوةً على ذلك، نقترح تعزيز الوحدة المُقترحة سابقًا، وهي وحدة التجميع الهرمي المكاني المتباعد (Atrous Spatial Pyramid Pooling)، التي تُحلل الخصائص التلافيفية على مقاييس متعددة، بإدخال خصائص الصورة على المستوى الكلي التي تعبر عن السياق العام، مما يؤدي إلى تحسين أداء النظام بشكل إضافي. كما نُفصّل في التفاصيل التنفيذية ونُشارك خبراتنا المتعلقة بتدريب نظامنا. يُظهر النظام المقترح، المُسمى DeepLabv3، تحسينًا ملحوظًا مقارنة بالإصدارات السابقة من DeepLab دون استخدام معالجة ما بعدية باستخدام DenseCRF، ويحقق أداءً مماثلًا لأفضل النماذج الحالية على معيار تقسيم الصور الدلالي PASCAL VOC 2012.