شبكة ESPNet: هرم فعال للتحويلات الموسعة للمجزأة الدلالية

نقدم شبكة عصبية تقنية التعلم العميق ESPNet، وهي شبكة سريعة وكفوءة لتقسيم الصور ذات الدقة العالية إلى أقسام معنى تحت قيود الموارد. تعتمد ESPNet على وحدة تجميعية جديدة، وهي الهرم المكاني الكفؤ (ESP)، والتي تكون كفوءة من حيث الحسابات والذاكرة والطاقة. تتميز ESPNet بأنها أسرع بـ22 مرة (على وحدة المعالجة الرسومية القياسية) وأصغر بـ180 مرة من الشبكة الرائدة في تقسيم الأقسام المعنى PSPNet، بينما يقل دقتها الفئوية بنسبة 8% فقط. قمنا بتقييم ESPNet على مجموعة متنوعة من مجموعات البيانات الخاصة بتقسيم الأقسام المعنى، بما في ذلك Cityscapes وPASCAL VOC ومجموعة بيانات صور الشرائح الكاملة للخزعة الثديية. تحت نفس القيود المتعلقة بالذاكرة والحاسبات، تتفوق ESPNet على جميع الشبكات الحالية الكفؤة مثل MobileNet وShuffleNet وENet في كل من المقاييس القياسية وفي مقاييس الأداء الجديدة التي قمنا بتطويرها لقياس الكفاءة على الأجهزة الحوافية. يمكن لشبكتنا معالجة الصور ذات الدقة العالية بمعدل 112 إطارًا في الثانية و9 إطارات في الثانية على وحدة المعالجة الرسومية القياسية وعلى الجهاز الحوافي، على التوالي.