مرشحات التفاف قابلة للتفسير مع SincNet

التعلم العميق يلعب حاليًا دورًا حاسمًا في تحقيق مستويات أعلى من الذكاء الاصطناعي. تتيح هذه المنهجية للشبكات العصبية التعلم تمثيلات معقدة ومستخلصة، والتي يتم الحصول عليها تدريجيًا من خلال دمج تمثيلات أبسط. ومع ذلك، غالبًا ما تعاني التمثيلات الداخلية "الصندوق الأسود" التي يتم اكتشافها تلقائيًا بواسطة الهياكل العصبية الحالية من نقص في القابلية للتفهم، مما يجعل دراسة تقنيات التعلم الآلي القابل للتفسير ذات أهمية أولى. يلخص هذا البحث جهودنا الأخيرة لتطوير نموذج عصبي أكثر قابلية للتفهم لمعالجة الكلام مباشرة من الشكل الموجي الخام. بشكل خاص، نقترح SincNet، وهو شبكة عصبية تلافيفية (CNN) جديدة تشجع الطبقة الأولى على اكتشاف مرشحات أكثر معنى من خلال استغلال الدوال sinc المشتقة مarametriًا. بخلاف الشبكات العصبية التلافيفية القياسية، التي تتعلم جميع عناصر كل مرشح، يتم تعلم الترددات المنخفضة والعالية فقط لمرشحات النطاق الضيق مباشرة من البيانات. يقدم هذا الانحياز الاستقرائي طريقة مضغوطة للغاية لاستنتاج جهاز أمامي مخصص للمرشحات المتعددة، والذي يعتمد فقط على بعض المعلمات ذات المعنى الفيزيائي الواضح. أظهرت تجاربنا، التي أجريت على التعرف على المتحدث والتعرف على الكلام، أن الهندسة المقترحة تتقارب بشكل أسرع وتؤدي بشكل أفضل وأكثر قابلية للتفهم من الشبكات العصبية التلافيفية القياسية.