منذ 2 أشهر
ParseNet: النظر أوسع للرؤية أفضل
Wei Liu; Andrew Rabinovich; Alexander C. Berg

الملخص
نقدم تقنية لإضافة السياق العالمي إلى شبكات التعلم العميق المتشابكة للتقسيم الدلالي. تتميز هذه الطريقة بالبساطة، حيث تستخدم ميزة الوسط لطبقة معينة لتعزيز الميزات في كل موقع. بالإضافة إلى ذلك، ندرس عدة خصائص فريدة من نوعها في التدريب، مما يزيد بشكل كبير من أداء الشبكات الأساسية (مثل FCN). عند إضافة الميزة العالمية المقترحة لدينا وتقنية لتعلم معلمات التطبيع، تتزايد الدقة باستمرار حتى على الإصدارات المحسنة من الشبكات الأساسية. يحقق النهج المقترح لدينا، ParseNet، أفضل الأداء الحالي على SiftFlow و PASCAL-Context مع زيادة حسابية طفيفة فوق الشبكات الأساسية، ويحقق أداءً قريباً من الأفضل حاليًا على تقسيم PASCAL VOC 2012 الدلالي باستخدام نهج بسيط. يمكن الوصول إلى الكود في https://github.com/weiliu89/caffe/tree/fcn .