HyperAIHyperAI

Command Palette

Search for a command to run...

فصل مصادر الموسيقى من النهاية إلى النهاية: هل هو ممكن في مجال الموجة الصوتية؟

Francesc Lluís Jordi Pons Xavier Serra

الملخص

معظم التقنيات الناجحة حاليًا في فصل المصادر تستخدم الطيف الطيفي للمقدار كمدخل، وبالتالي فإنها تتخطى جزءًا من الإشارة: الطور. لتجنب تجاهل المعلومات المحتمل أن تكون مفيدة، ندرس جدوى استخدام النماذج من البداية إلى النهاية لفصل مصادر الموسيقى --- والتي تأخذ بعين الاعتبار جميع المعلومات المتاحة في الإشارة الصوتية الخام، بما في ذلك الطور. رغم أن فصل مصادر الموسيقى من البداية إلى النهاية كان يعتبر شبه مستحيل خلال العقود الماضية، فإن نتائجنا تؤكد أن النماذج القائمة على الموجة الصوتية يمكن أن تعمل بشكل مشابه (إذا لم يكن أفضل) من نموذج التعلم العميق القائم على الطيف الطيفي للمقدار. تحديدًا: يمكن للنموذج الذي نقترحه ويعتمد على Wavenet ونموذج Wave-U-Net أن يتفوقا على DeepConvSep، وهو نموذج التعلم العميق الحديث القائم على الطيف الطيفي للمقدار.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp