HyperAIHyperAI
منذ 17 أيام

الكشف عن الكلمات المفتاحية من الطرف إلى الطرف باستخدام البحث في البنية العصبية والكمّية

David Peter, Wolfgang Roth, Franz Pernkopf
الكشف عن الكلمات المفتاحية من الطرف إلى الطرف باستخدام البحث في البنية العصبية والكمّية
الملخص

يقدّم هذا البحث طريقة لاستكشاف الهياكل العصبية (NAS) للاكتشاف التلقائي لنماذج التعرف على الكلمات المفتاحية (KWS) من البداية إلى النهاية في بيئات موارد محدودة. نستخدم نهج NAS القابل للتفاضل لتحسين بنية الشبكات العصبية التلافيفية (CNNs) العاملة على موجات الصوت الخام. وبعد العثور على نموذج KWS المناسب باستخدام NAS، نُطبّق تقليل دقة الأوزان والانفعالات لتقليل الحجم الذاكرة. قمنا بإجراء تجارب واسعة على مجموعة بيانات أوامر الصوت من جوجل. وتحديدًا، قارنا نهجنا من البداية إلى النهاية مع الأنظمة القائمة على معاملات كوسوف-تيرم (MFCC). أما بالنسبة للتقليل الدقيق، فقد قارنا بين التقليل بعرض بت ثابت وبين التقليل المُدرَّب بعرض بت متغير. باستخدام NAS وحده، تمكّنا من تحقيق نموذج عالي الكفاءة بدقة 95.55% باستخدام 75.7 ألف معلمة و13.6 مليون عملية. وباستخدام التقليل الدقيق المُدرَّب بعرض بت متغير، حقق نفس النموذج دقة اختبار تبلغ 93.76% مع استخدام متوسط 2.91 بت لكل انفعال و2.51 بت لكل وزن.

الكشف عن الكلمات المفتاحية من الطرف إلى الطرف باستخدام البحث في البنية العصبية والكمّية | أحدث الأوراق البحثية | HyperAI