شبكات عصبية غير محلية سريعة وقابلة للتفسير للتصحيح الصوتي للصور عبر تعلم قاموس التفويض المجموعي النادر

التشابه الذاتي غير المحلي داخل الصور الطبيعية أصبح مبدأ متزايد الشعبية في نماذج التعلم العميق. على الرغم من أدائها الناجح في استعادة الصور، تظل هذه النماذج إلى حد كبير غير قابلة للتفسير بسبب بنائها كصناديق سوداء. أظهرت دراساتنا السابقة أن من الممكن تحقيق بناء قابل للتفسير لنموذج الترشيح الكامل بالدورة (CDLNet) بأداء يوازي أفضل النماذج المعاصرة التي تعمل كصناديق سوداء، وذلك عن طريق فك لفائف خوارزمية تعلم القاموس. في هذا الكتاب، نسعى لتحقيق بناء قابل للتفسير لنظام دوري مع مبدأ التشابه الذاتي غير المحلي الذي يؤدي بأداء يوازي نماذج الصناديق السوداء غير المحلية. نوضح أن مثل هذا البنية يمكن تحقيقها بكفاءة عن طريق تطوير أولوية الندرة $\ell 1$ في CDLNet إلى أولوية ندرة مجموعات موزونة. من خلال هذه الصياغة، نقترح عملية تشغيل غير محلية جديدة تعتمد على حساب المصفوفات النادرة بمنطق الشرائح المتحركة. بالإضافة إلى الأداء التنافسي مع نماذج الشبكات العصبية العميقة غير المحلية (DNNs)، نثبت أن الانتباه النادر بمنطق الشرائح المتحركة المقترح يمكّن سرعات الاستدلال أكبر بمقدار عشري أو أكثر من منافسيه.