HyperAIHyperAI
منذ 17 أيام

إلى التعرف على الكلمات المفتاحية على الجهاز باستخدام نماذج عصبية كواتيرنيونية ذات حجم منخفض

{Vinayak Abrol, Aryan Chaudhary}
الملخص

يُعدّ الكشف عن الكلمة المفتاحية على الجهاز (KWS) عنصراً أساسياً للتنبيه والتفاعل مع المستخدم في الأجهزة الحافة الذكية. تعتمد النماذج ذات الحجم الصغير الحالية بشكل رئيسي على التحويلات ثنائية الأبعاد وذات البعد الواحد، حيث تتفوّق الأولى في التقاط التحولات الثابتة، بينما تتيح الثانية وقت استجابة أسرع. في هذا العمل، نستكشف نماذج الشبكة العصبية الكويرتنيّة كبديل فعّال للنمذجة الصوتية في مهمة كشف الكلمة المفتاحية. تتيح النماذج الكويرتنيّة دمج جوانب متعددة من ميزات الإدخال داخل الأبعاد المتعددة لفضاء الكويرتنيات، مما يؤدي إلى نماذج أصغر وأكثر كفاءة مقارنةً بالنماذج التقليدية. نُظهر ذلك من خلال استخدام نسخ كويرتنيّة من نماذج KWS الشهيرة على مجموعة بيانات Google Command V2، حيث تحقق نماذجنا أداءً مماثلاً للنماذج الحالية. بالإضافة إلى ذلك، نقدّم تحليلًا شاملاً لسلوك التعلّم في الشبكة الكويرتنيّة، بهدف تبرير استخدامها في مهام صوتية وصوتية أخرى.