HyperAIHyperAI

Command Palette

Search for a command to run...

إعادة التفكير في التحويل الشبكي النافذ لتقسيم الصور المعنوية

Chen Liang-Chieh Papandreou George Schroff Florian Adam Hartwig

الملخص

في هذه الدراسة، نعيد النظر في التحويل المتباعد (atrous convolution)، وهو أداة قوية تُستخدم لضبط مجال تأثير المرشح (field-of-view) بشكل صريح، وكذلك لضبط دقة الاستجابات المميزة التي تُحسب بواسطة الشبكات العصبية التلافيفية العميقة (Deep Convolutional Neural Networks)، وذلك في تطبيق تقسيم الصور الدلالي (semantic image segmentation). ولمعالجة مشكلة تقسيم الكائنات على مقاييس متعددة، نصمم وحدات تستخدم التحويل المتباعد بشكل متسلسل أو متوازٍ لالتقاط السياق متعدد المقاييس من خلال اعتماد معدلات متباعدة متعددة. علاوةً على ذلك، نقترح تعزيز الوحدة المُقترحة سابقًا، وهي وحدة التجميع الهرمي المكاني المتباعد (Atrous Spatial Pyramid Pooling)، التي تُحلل الخصائص التلافيفية على مقاييس متعددة، بإدخال خصائص الصورة على المستوى الكلي التي تعبر عن السياق العام، مما يؤدي إلى تحسين أداء النظام بشكل إضافي. كما نُفصّل في التفاصيل التنفيذية ونُشارك خبراتنا المتعلقة بتدريب نظامنا. يُظهر النظام المقترح، المُسمى DeepLabv3، تحسينًا ملحوظًا مقارنة بالإصدارات السابقة من DeepLab دون استخدام معالجة ما بعدية باستخدام DenseCRF، ويحقق أداءً مماثلًا لأفضل النماذج الحالية على معيار تقسيم الصور الدلالي PASCAL VOC 2012.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp