HyperAIHyperAI
منذ 2 أشهر

شبكات عصبية قنوية فعّالة ومعمقة للفصل الدلالي

Sharif Amit Kamran; Ali Shihab Sabbir
شبكات عصبية قنوية فعّالة ومعمقة للفصل الدلالي
الملخص

التمييز الدلالي باستخدام الشبكات العصبية التلافيفية العميقة يمثل تحديًا أكثر تعقيدًا لأي مهمة مكثفة لوحدة معالجة الرسومات (GPU). حيث يجب حساب ملايين المعلمات، مما يؤدي إلى استهلاك كبير للذاكرة. بالإضافة إلى ذلك، استخراج الخصائص الدقيقة وإجراء التدريب الإشرافي يميل إلى زيادة التعقيد. ومع ظهور الشبكات العصبية التلافيفية الكاملة (Fully Convolutional Neural Network)، التي تستخدم خطوات أدق وتستفيد من طبقات التفكيك التلافيفي (deconvolutional) للتكبير، أصبحت الخيار المفضل لأي مهمة تمييز صوري.في هذا البحث، نقترح هندستين للتمييز تتطلبان ثلث المعلمات فقط التي تحتاجها الهندسات المشابهة ولكنها توفر دقة أفضل. تم نقل أوزان النموذج من شبكات عصبية شائعة مثل VGG19 وVGG16 التي تم تدريبها على مجموعة بيانات تصنيف Imagenet. ثم قمنا بتحويل جميع الطبقات المتصلة بالكامل إلى طبقات تلافيفية واستخدمنا التفكيك المخفف (dilated convolution) لتقليل عدد المعلمات. وأخيرًا، أضفنا خطوات أدق وربطنا أربع هياكل تخطيطية يتم جمعها عنصرًا بعنصر مع طبقات التفكيك التلافيفي في خطوات متتابعة.قمنا بتدريب واختبار النماذج على مجموعات بيانات مختلفة ومتناثرة ودقيقة مثل Pascal VOC2012 وPascal-Context وNYUDv2 وأظهرنا كيف يكون أداؤنا أفضل في هذه المهام. من ناحية أخرى، فإن نموذجنا لديه وقت استدلال أسرع ويستهلك ذاكرة أقل أثناء التدريب والاختبار على وحدات معالجة الرسومات NVIDIA Pascal، مما يجعله بنية أكثر كفاءة وأقل استهلاكًا للذاكرة للتمييز البكسل بدقة.

شبكات عصبية قنوية فعّالة ومعمقة للفصل الدلالي | أحدث الأوراق البحثية | HyperAI