الملخص

نقدم الجيل التالي من شبكات MobileNets المستندة إلى مزيج من تقنيات البحث المكملة وتصميم هندسي جديد. تم ضبط MobileNetV3 لمعالجات الهواتف المحمولة من خلال مزيج من البحث عن التصميم الهندسي للشبكة مع الوعي بالأجهزة (Network Architecture Search (NAS))، والمكمل بواسطة خوارزمية NetAdapt، ثم تم تحسينه لاحقًا من خلال تقدمات هندسية جديدة. يبدأ هذا البحث استكشاف كيفية عمل خوارزميات البحث الآلي والتصميم الشبكي معًا للاستفادة من النهج المكملة وتحسين الحالة الفنية العامة. ومن خلال هذه العملية، ننشئ نموذجين جديدين من MobileNet للإطلاق: MobileNetV3-Large وMobileNetV3-Small، وهما مستهدفان لحالات الاستخدام ذات الموارد العالية والمنخفضة. يتم تعديل هذه النماذج وتطبيقها على مهام الكشف عن الأشياء والتقسيم الدلالي. بالنسبة لمهمة التقسيم الدلالي (أو أي تنبؤ كثيف بالبكسل)، نقترح محول فصل جديد وكفء يُعرف بـ Lite Reduced Atrous Spatial Pyramid Pooling (LR-ASPP). نحقق نتائج جديدة في الطليعة لتصنيف الهواتف المحمولة، والكشف عنها، والتقسيم الدلالي. يعتبر MobileNetV3-Large أكثر دقة بنسبة 3.2٪ في تصنيف ImageNet مع تقليل وقت الاستجابة بنسبة 15٪ مقارنةً بـ MobileNetV2. بينما يعتبر MobileNetV3-Small أكثر دقة بنسبة 4.6٪ مع تقليل وقت الاستجابة بنسبة 5٪ مقارنةً بـ MobileNetV2. كما أن الكشف باستخدام MobileNetV3-Large أسرع بنسبة 25٪ عند مستوى دقة مشابه لـ MobileNetV2 في الكشف عن COCO. وفيما يتعلق بتقسيم Cityscapes، فإن استخدام MobileNetV3-Large مع LR-ASPP أسرع بنسبة 30٪ مقارنةً بـ MobileNetV2 R-ASPP عند مستوى دقة مشابه.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار