منذ 2 أشهر
SepIt: الاقتراب من حد فصل الكلام في قناة واحدة
Shahar Lutati; Eliya Nachmani; Lior Wolf

الملخص
نقدم حدًا علويًا لمهمة فصل الكلام من قناة واحدة (Single Channel Speech Separation)، وهو يعتمد على افتراض يتعلق بطبيعة المقاطع القصيرة من الكلام. باستخدام هذا الحد، نتمكن من إظهار أن الطرق الحديثة قد أحرزت تقدمًا كبيرًا في حالة عدد قليل من المتحدثين، ولكن لا يزال هناك مجال للتحسين في حالة خمسة وعشرة متحدثين. ثم نقدم شبكة عصبية عميقة تُسمى SepIt، والتي تحسن تقديرات المتحدثين المختلفين بشكل متكرر. أثناء الاختبار، يتم تنفيذ عدد متغير من التكرارات لكل عينة اختبار، استنادًا إلى معيار المعلومات المتبادلة الناشئ من تحليلنا. في مجموعة واسعة من التجارب، أظهر SepIt تفوقه على الشبكات العصبية الأكثر تقدمًا حاليًا لـ 2 و3 و5 و10 متحدثين.