منذ 6 أشهر

الملخص

في هذه الورقة، نقدم شبكة عصبية فعّالة للانفصال الصوتي المصدري العام من الطرف إلى الطرف. بشكل خاص، يُشكّل هيكل الأساس لهذا الشبكة التلافيفية بنية SUccessive DOwnsampling and Resampling of Multi-Resolution Features (SuDoRMRF)، إلى جانب تجميع ميزات متعددة الدقة الذي يتم عبر عمليات تلافيفية أحادية البُعد بسيطة. وبهذا، نتمكن من تحقيق انفصال صوتي عالي الجودة مع عدد محدود من العمليات الحسابية ذات الفاصلة العائمة، ومتطلبات الذاكرة، وعدد المعلمات، والتأخير. تُظهر تجاربنا على مجموعتي بيانات للانفصال الصوتي بين الكلام والأصوات البيئية أداءً مُتنافسًا، بل وحتى تفوقًا، لطريقة SuDoRMRF مقارنةً بطرق متقدمة حديثة، مع متطلبات موارد حسابية أعلى بشكل ملحوظ.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار