HyperAIHyperAI
منذ 11 أيام

شبكات الفرق البكسلية للكشف الفعّال عن الحواف

Zhuo Su, Wenzhe Liu, Zitong Yu, Dewen Hu, Qing Liao, Qi Tian, Matti Pietikäinen, Li Liu
شبكات الفرق البكسلية للكشف الفعّال عن الحواف
الملخص

في الآونة الأخيرة، تمكن الشبكات العصبية التلافيفية العميقة (CNN) من تحقيق أداءً يعادل الأداء البشري في كشف الحواف بفضل قدراتها العالية في تمثيل الحواف الغنية والمركبة. ومع ذلك، فإن الأداء العالي للكشف عن الحواف القائم على الشبكات العصبية التلافيفية يُحقَّق بفضل استخدام هيكل أساسي كبير مُدرَّب مسبقًا، مما يُعدّ مُستهلكًا للذاكرة والطاقة. إضافةً إلى ذلك، من المُدهش أن المعرفة السابقة المُستمدة من مُكتشفات الحواف التقليدية، مثل طريقة كاني (Canny) وسوبيل (Sobel) وLBP، لم تُدرَس بشكل واسع خلال العصر السريع التطور للتعلم العميق. ولحل هذه المشكلات، نقترح بنية بسيطة وخفيفة الوزن ولكنها فعالة تُسمى شبكة الفرق بين البكسل (PiDiNet) للكشف الفعّال عن الحواف. وتم تقديم تجارب واسعة على مجموعات بيانات BSDS500 وNYUD وMulticue لإثبات فعالية هذه البنية، فضلًا عن كفاءتها العالية في التدريب والاستنتاج. ومن المُدهش أن PiDiNet، عند تدريبها من الصفر باستخدام بيانات BSDS500 وVOC فقط، تمكنت من تجاوز النتيجة المسجلة للإدراك البشري (0.807 مقابل 0.803 في مقياس F-مقياس ODS) على مجموعة بيانات BSDS500، مع سرعة تصل إلى 100 إطارًا في الثانية وبمُعلّمات أقل من مليون معلمة. كما أن النسخة الأسرع من PiDiNet التي تمتلك أقل من 0.1 مليون معلمة لا تزال تحقق أداءً مُقارنًا بأفضل النماذج الحالية بسرعة تصل إلى 200 إطارًا في الثانية. وتُظهر النتائج على مجموعتي بيانات NYUD وMulticue ملاحظات مشابهة. يمكن الاطلاع على الكود من خلال الرابط التالي: https://github.com/zhuoinoulu/pidinet.

شبكات الفرق البكسلية للكشف الفعّال عن الحواف | أحدث الأوراق البحثية | HyperAI