منذ 17 أيام
Sudo rm -rf: شبكات فعالة للانفصال الصوتي العام للمصادر
Efthymios Tzinis, Zhepei Wang, Paris Smaragdis

الملخص
في هذه الورقة، نقدم شبكة عصبية فعّالة للانفصال الصوتي المصدري العام من الطرف إلى الطرف. بشكل خاص، يُشكّل هيكل الأساس لهذا الشبكة التلافيفية بنية SUccessive DOwnsampling and Resampling of Multi-Resolution Features (SuDoRMRF)، إلى جانب تجميع ميزات متعددة الدقة الذي يتم عبر عمليات تلافيفية أحادية البُعد بسيطة. وبهذا، نتمكن من تحقيق انفصال صوتي عالي الجودة مع عدد محدود من العمليات الحسابية ذات الفاصلة العائمة، ومتطلبات الذاكرة، وعدد المعلمات، والتأخير. تُظهر تجاربنا على مجموعتي بيانات للانفصال الصوتي بين الكلام والأصوات البيئية أداءً مُتنافسًا، بل وحتى تفوقًا، لطريقة SuDoRMRF مقارنةً بطرق متقدمة حديثة، مع متطلبات موارد حسابية أعلى بشكل ملحوظ.