HyperAIHyperAI
منذ 2 أشهر

فصل مصادر الموسيقى من النهاية إلى النهاية: هل هو ممكن في مجال الموجة الصوتية؟

Francesc Lluís; Jordi Pons; Xavier Serra
فصل مصادر الموسيقى من النهاية إلى النهاية: هل هو ممكن في مجال الموجة الصوتية؟
الملخص

معظم التقنيات الناجحة حاليًا في فصل المصادر تستخدم الطيف الطيفي للمقدار كمدخل، وبالتالي فإنها تتخطى جزءًا من الإشارة: الطور. لتجنب تجاهل المعلومات المحتمل أن تكون مفيدة، ندرس جدوى استخدام النماذج من البداية إلى النهاية لفصل مصادر الموسيقى --- والتي تأخذ بعين الاعتبار جميع المعلومات المتاحة في الإشارة الصوتية الخام، بما في ذلك الطور. رغم أن فصل مصادر الموسيقى من البداية إلى النهاية كان يعتبر شبه مستحيل خلال العقود الماضية، فإن نتائجنا تؤكد أن النماذج القائمة على الموجة الصوتية يمكن أن تعمل بشكل مشابه (إذا لم يكن أفضل) من نموذج التعلم العميق القائم على الطيف الطيفي للمقدار. تحديدًا: يمكن للنموذج الذي نقترحه ويعتمد على Wavenet ونموذج Wave-U-Net أن يتفوقا على DeepConvSep، وهو نموذج التعلم العميق الحديث القائم على الطيف الطيفي للمقدار.

فصل مصادر الموسيقى من النهاية إلى النهاية: هل هو ممكن في مجال الموجة الصوتية؟ | أحدث الأوراق البحثية | HyperAI