HyperAIHyperAI

Command Palette

Search for a command to run...

فصل الصوت مع عدد غير معروف من المتكلمين المتعددين

Eliya Nachmani Yossi Adi Lior Wolf

الملخص

نقدم طريقة جديدة لفصل تسلسل صوتي مختلط، حيث يتحدث أكثر من صوت بشكل متزامن. تعتمد الطريقة الجديدة على شبكات عصبية مُدارة (gated neural networks) التي تُدرّب على فصل الأصوات في عدة مراحل معالجة، مع الحفاظ على ثبات المتحدث في كل قناة من المخرجات. يتم تدريب نموذج مختلف لكل عدد محتمل من المتكلمين، ويُستخدم النموذج الذي يدعم أكبر عدد من المتكلمين لتحديد العدد الفعلي للمتكلمين في العينة المعطاة. تتفوق طريقة العمل هذه بشكل كبير على أحدث الطرق المتوفرة، كما نُظهر أن هذه الطرق السابقة لا تُعدّ منافسة فعّالة عندما يتجاوز عدد المتكلمين اثنين.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp