ESPNetv2: شبكة عصبية تقنية وخفيفة الوزن وكفاءة الطاقة وعامة الغرض للتعلم العميق

نقدم شبكة عصبية تقنية جديدة خفيفة الوزن، فعالة في استهلاك الطاقة، وذات غرض عام تُعرف بـ ESPNetv2، لنمذجة البيانات البصرية والمتسلسلة. تعتمد شبكتنا على عمليات التجميع النقطي المجموع والتفكيك العميق المخفف لتعلم التمثيلات من مجال استقبال فعال كبير باستخدام عدد أقل من العمليات العائمة (FLOPs) والمعلمات. تم تقييم أداء شبكتنا في أربع مهام مختلفة: (1) تصنيف الأشياء، (2) الفصل الدلالي، (3) كشف الأشياء، و(4) نمذجة اللغة. تشمل التجارب التي أجريت على هذه المهام تصنيف الصور على مجموعة بيانات ImageNet ونمذجة اللغة على مجموعة بيانات PenTree bank، والتي أظهرت الأداء المتفوق لطريقتنا مقارنة بالطرق الرائدة حاليًا. حققت شبكتنا تفوقًا بنسبة 4-5% على ESPNet مع وجود 2-4 ضعف أقل من العمليات العائمة (FLOPs) في مجموعتي بيانات PASCAL VOC وCityscapes. مقارنة بـ YOLOv2 في كشف الأشياء على مجموعة بيانات MS-COCO، توفر ESPNetv2 دقة أعلى بنسبة 4.4% مع 6 ضعف أقل من العمليات العائمة (FLOPs). أظهرت تجاربنا أن ESPNetv2 أكثر فعالية في استهلاك الطاقة بكثير من الطرق الفعالة الرائدة حاليًا مثل ShuffleNets وMobileNets. الكود الخاص بنا متاح ومصدره مفتوح على الرابط https://github.com/sacmehta/ESPNetv2