Command Palette
Search for a command to run...
MnasNet: البحث عن هندسة عصبية واعية للمنصة للموبايل
MnasNet: البحث عن هندسة عصبية واعية للمنصة للموبايل
Mingxing Tan Bo Chen Ruoming Pang Vijay Vasudevan Mark Sandler Andrew Howard Quoc V. Le
Abstract
تصميم شبكات العصبونات المتشابكة (CNN) للأجهزة المحمولة يمثل تحديًا لأن نماذج الأجهزة المحمولة يجب أن تكون صغيرة وسريعة، ومع ذلك دقيقة. رغم الجهود الكبيرة التي بُذلت لتصميم وتحسين شبكات العصبونات المتنقلة (CNN) في جميع الأبعاد، فإن توازن هذه التنازلات يدويًا أمر صعب للغاية عندما يكون هناك العديد من الاحتمالات الهندسية للنظر فيها. في هذا البحث، نقترح نهجًا آليًا للبحث عن هندسة الشبكة العصبية المتنقلة (MNAS)، والذي يدمج بشكل صريح زمن الاستجابة للنموذج في الهدف الرئيسي بحيث يمكن للبحث تحديد نموذج يحقق توازنًا جيدًا بين الدقة وزمن الاستجابة. على عكس الأعمال السابقة، حيث يتم النظر إلى زمن الاستجابة عبر وسيط آخر غالبًا ما يكون غير دقيق (مثل FLOPS)، فإن نهجنا يقوم بقياس زمن الاستدلال الفعلي في العالم الحقيقي من خلال تنفيذ النموذج على الهواتف المحمولة. لتعزيز التوازن الصحيح بين المرونة وحجم مساحة البحث، نقترح مساحة بحث متدرجة مجزأة جديدة تشجع على التنوع الطبقي عبر الشبكة. تظهر النتائج التجريبية أن نهجنا يتخطى باستمرار أفضل النماذج الحالية لشبكات العصبونات المتنقلة (CNN) في مجموعة متنوعة من مهمات الرؤية. في مهمة تصنيف ImageNet، يصل MnasNet إلى دقة 75.2% في المركز الأول مع زمن استجابة قدره 78 مللي ثانية على هاتف Pixel، وهو أسرع بمقدار 1.8 مرة من MobileNetV2 [29] مع زيادة دقة بنسبة 0.5% وأسرع بمقدار 2.3 مرة من NASNet [36] مع زيادة دقة بنسبة 1.2%. كما حقق MnasNet جودة mAP أفضل من MobileNets في كشف الأشياء COCO. الكود متاح على https://github.com/tensorflow/tpu/tree/master/models/official/mnasnet