HyperAIHyperAI

Command Palette

Search for a command to run...

التنبؤ غير الخطي باستخدام الشبكات العصبية التكرارية LSTM للكشف عن الجديد الصوتي

Erik Marchi ; Fabio Vesperini ; Felix Weninger ; Florian Eyben ; Stefano Squartini ; Björn Schuller

الملخص

يهدف الكشف عن الأحداث الصوتية غير المألوفة إلى تحديد الإشارات الصوتية غير العادية/الجديدة التي تختلف عن البيانات المرجعية/العادية التي تم تدريب النظام عليها. في هذه الورقة، نقدم منهجية جديدة تعتمد على مُشفّرات تصفية الضوضاء التنبؤية غير الخطية. في منهجيتنا، يتم التنبؤ بسمات الطيف الصوتي للإطار القصير الأمد التالي من خلال الإطارات السابقة باستخدام مُشفّرات التصفية التنبؤية ذات الذاكرة الطويلة والقصيرة (LSTM). ونُظهر أن هذا النهج يُنتج نموذجًا توليديًا فعّالًا للصوت. ويُستخدم خطأ إعادة البناء بين المدخل والمخرج في المُشفّر كإشارة تنشيط للكشف عن الأحداث الجديدة. وتم تدريب المُشفّر على قاعدة بيانات عامة تحتوي على تسجيلات لحالات منزلية شائعة مثل الحديث، ومشاهدة التلفاز، واللعب، والأكل. وتم إجراء التقييم على أكثر من 260 حدثًا غير عادي مختلف. ونقارن النتائج مع الطرق الرائدة في المجال، ونتوصل إلى أن منهجيتنا الجديدة تفوق بشكل ملحوظ الطرق الحالية، حيث تحقق ما يصل إلى 94.4% من معامل F.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
التنبؤ غير الخطي باستخدام الشبكات العصبية التكرارية LSTM للكشف عن الجديد الصوتي | مستندات | HyperAI