شبكات كثيفة متعددة القياسات لتصنيف الصور بكفاءة الموارد

في هذا البحث، نقوم بدراسة تصنيف الصور مع قيود في الموارد الحاسوبية وقت الاختبار. هناك نوعان من هذه الظروف هما: 1. التصنيف في أي وقت، حيث يتم تحديث تنبؤ الشبكة لمثال اختباري بشكل تدريجي، مما يسهل إصدار التنبؤ في أي وقت؛ و2. التصنيف الدُفعاتِي المُقَدَّر بالميزانية، حيث يكون هناك كمية حسابية ثابتة متاحة لتصنيف مجموعة من الأمثلة يمكن توزيعها بشكل غير متساوٍ بين المدخلات "الأبسط" و"الأصعب". على عكس معظم الأعمال السابقة، مثل الخوارزمية الشهيرة لفيولا وجونز (Viola and Jones)، فإن نهجنا يستند إلى شبكات العصبونات المتكررة (Convolutional Neural Networks). نقوم بتدريب عدة تصنيفات ذات طلبات موارد مختلفة، والتي نطبقها بشكل متكيف أثناء الاختبار. للحد الأقصى من إعادة استخدام الحسابات بين المصنفات، ندمجها كمخارج مبكرة في شبكة عصبونات متكررة عميقة واحدة ونربطها باتصال كثيف. لتسهيل الحصول على تصنيف عالي الجودة في وقت مبكر، نستخدم بنية شبكة متعددة المقاييس ثنائية الأبعاد تحافظ على الخصائص الخشنة والدقيقة طوال الشبكة. تظهر التجارب على ثلاث مهمات لتصنيف الصور أن إطار عملنا يحسن بشكل كبير الحالة الراهنة للتقنية في كلتا الحالتين.