Command Palette
Search for a command to run...
شبكات كثيفة متعددة المقياس لتصنيف الصور بكفاءة في استخدام الموارد
شبكات كثيفة متعددة المقياس لتصنيف الصور بكفاءة في استخدام الموارد
الملخص
في هذه الورقة، نُجري دراسة حول تصنيف الصور ضمن قيود محددة على الموارد الحاسوبية أثناء مرحلة الاختبار. وتشمل هاتين الحالتين ما يلي: 1. التصنيف في أي وقت (anytime classification)، حيث يتم تحديث تنبؤ الشبكة بالنسبة لعينة اختبار بشكل تدريجي، مما يمكّن من إصدار نتيجة تنبؤ في أي لحظة؛ و2. التصنيف بالميزانية (budgeted batch classification)، حيث يكون هناك كمية ثابتة من الحوسبة متوفرة لتصنيف مجموعة من العينات، ويمكن توزيع هذه الكمية بشكل غير متساوٍ بين العينات "الأسهل" و"الصعبة" من حيث التصنيف. على عكس معظم الدراسات السابقة، مثل خوارزمية فيولا وجونز الشهيرة، يعتمد نهجنا على الشبكات العصبية التلافيفية (convolutional neural networks). نقوم بتدريب عدة تصنيفات ذات متطلبات موارد مختلفة، ونُطبّقها بشكل تكيفي أثناء مرحلة الاختبار. ولتحقيق أقصى استفادة من إعادة استخدام الحوسبة بين التصنيفات المختلفة، نُدمج هذه التصنيفات كمخارج مبكرة (early-exits) داخل شبكة عصبية عميقة واحدة، ونربطها باتصالات كثيفة (dense connectivity). ولتمكين تصنيف عالي الجودة في المراحل المبكرة، نستخدم بنية شبكة ثنائية الأبعاد ذات مقياس متعدد، تُحافظ على ميزات المستوى الخشن والمستوى الدقيق طوال طول الشبكة. أظهرت التجارب على ثلاث مهام لتصنيف الصور أن إطارنا يُحسّن بشكل كبير من الحالة الراهنة (state-of-the-art) في كلا الحالتين.