HyperAIHyperAI

Command Palette

Search for a command to run...

تصحيح الطيف: تصنيف المشهد الصوتي مع أجهزة تسجيل غير متطابقة

Michał Kośmider

الملخص

عند تدريب خوارزميات التعلم الآلي على تسجيلات صوتية من مجموعة محدودة من الأجهزة، قد لا تُظهر أداءً جيدًا عند تطبيقها على عينات تم تسجيلها باستخدام أجهزة أخرى ذات استجابة ترددية مختلفة. في هذه الدراسة، تم تقديم طريقة نسبيًا بسيطة لمعالجة هذه المشكلة. وتم عرض نسختين من هذا النهج: الأولى تتطلب أمثلة مُحاذاة من عدة أجهزة، بينما تخفف النسخة الثانية من هذه المتطلبات. تعمل هذه الطريقة على تمثيلات الصوت في كل من المجال الزمني والمجال الترددي. بالإضافة إلى ذلك، تم تحليل العلاقة بين هذه الطريقة والتوحيد (Standardization) وطرح المتوسط السبيتري (Cepstral Mean Subtraction). وقد أظهرت الطريقة فعاليتها حتى عند توفر عدد قليل جدًا من الأمثلة. وقد تم تطوير هذه الطريقة خلال مسابقة الكشف والتصنيف المشاهد والحوادث الصوتية (DCASE) 2019، وحققت المركز الأول في السيناريو الذي يشمل أجهزة تسجيل غير متطابقة، بتحقيق دقة وصلت إلى 75%. ويمكن العثور على الشفرة المصدرية للتجارب عبر الإنترنت.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp