HyperAIHyperAI

Command Palette

Search for a command to run...

MatchboxNet: معمارية شبكة عصبية تلافيفية زمنية-قناة من الدرجة الأولى للاعتراف بتعليمات الصوت

Somshubra Majumdar Boris Ginsburg

الملخص

نقدّم نموذج MatchboxNet – شبكة عصبية من النهاية إلى النهاية لتمييز أوامر الكلام. يتكوّن MatchboxNet من شبكة عميقة ذات تراكيب تُعرف بـ "الشبكة المتبقية"، وتشمل كتلًا من التحويلات الثنائية الأبعاد (1D) المُفصَّلة في الزمن والقناة، بالإضافة إلى طبقات التطبيع الدفعي (Batch-Normalization)، ووظيفة التنشيط ReLU، وطبقات التخفيض (Dropout). وقد حقق MatchboxNet دقةً متقدمة على مستوى الحالة الحالية (State-of-the-art) في مجموعة بيانات Google Speech Commands، مع عدد مُحدود جدًا من المعاملات مقارنةً بالنماذج المشابهة. ويُعدّ الحجم الصغير للنموذج ميزة جذابة له في الأجهزة ذات الموارد الحسابية المحدودة. كما أن النموذج قابل للتوسع بدرجة عالية، مما يسمح بتحسين دقة النموذج بزيادة طفيفة في الذاكرة والقدرة الحسابية. وأخيرًا، نُظهر كيف أن استخدام التضخيم المكثّف للبيانات باستخدام مجموعة ضوضاء ثانوية يُحسّن مقاومة النموذج في بيئة مليئة بالضوضاء الخلفية.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
MatchboxNet: معمارية شبكة عصبية تلافيفية زمنية-قناة من الدرجة الأولى للاعتراف بتعليمات الصوت | مستندات | HyperAI