HyperAIHyperAI
منذ 17 أيام

تحسين الأداء الناتج عن الجمع بين التقنيات في شبكة عصبية تلافيفية

Jungkyu Lee, Taeryun Won, Tae Kwan Lee, Hyemin Lee, Geonmo Gu, Kiho Hong
تحسين الأداء الناتج عن الجمع بين التقنيات في شبكة عصبية تلافيفية
الملخص

أظهرت الدراسات الحديثة في تصنيف الصور مجموعة متنوعة من التقنيات التي تُحسّن أداء الشبكات العصبية التلافيفية (CNN). ومع ذلك، لا تزال المحاولات المبذولة لدمج التقنيات الحالية لبناء نموذج عملي نادرة نسبيًا. في هذه الدراسة، نُجري تجارب واسعة النطاق للتحقق من أن تجميع هذه التقنيات بعناية وتطبيقها على النماذج الأساسية للشبكات التلافيفية (مثل ResNet وMobileNet) يمكن أن يُحسّن دقة النماذج وثباتها، مع الحد الأدنى من فقدان الإنتاجية (throughput). يُظهر النموذج المُجمَّع المُقترح من نوع ResNet-50 تحسينات في الدقة المُرتبة الأولى (top-1 accuracy) من 76.3% إلى 82.78%، وفي المقياس المتوسط للخطأ التصنيفي (mCE) من 76.0% إلى 48.9%، وفي المقياس المتوسط للخطأ في التصنيف الخفي (mFR) من 57.7% إلى 32.3% على مجموعة التحقق ILSVRC2012. وبهذه التحسينات، انخفضت إنتاجية الاستدلال (inference throughput) فقط من 536 إلى 312. وللتحقق من تحسين الأداء في التعلم الانتقالي (transfer learning)، تم اختبار المهام المتعلقة بالتصنيف الدقيق (fine-grained classification) واسترجاع الصور على عدة مجموعات بيانات عامة، وأظهرت النتائج أن تحسين أداء الشبكة الأساسية (backbone network) قد ساهم بشكل كبير في تعزيز أداء التعلم الانتقالي. وحققت طريقة البحث هذه المركز الأول في مسابقة iFood Competition للتصنيف البصري الدقيق في مؤتمر CVPR 2019، كما أن الكود المصدري والنماذج المدربة متوفرة على الرابط التالي: https://github.com/clovaai/assembled-cnn

تحسين الأداء الناتج عن الجمع بين التقنيات في شبكة عصبية تلافيفية | أحدث الأوراق البحثية | HyperAI