Speech Separation
فصل الكلام يشير إلى مهمة استخراج جميع مصادر الكلام المتداخلة من إشارة كلام مختلطة. كسيناريو محدد من مشاكل فصل المصادر، يركز فصل الكلام بشكل أساسي على عزل الإشارات الصوتية المتعددة التي تحدث في نفس الوقت بدلاً من الإشارات المتدخلة الأخرى مثل الموسيقى أو الضوضاء. تتمتع هذه التقنية بقيمة تطبيقية كبيرة في مجال التعرف على الكلام في بيئات متعددة المتحدثين، وأجهزة المساعدة السمعية، وتحرير الصوت.
GRID corpus (mixed-speech)
iKala
U-Net
Libri10Mix
Libri15Mix
Hungarian PIT
Libri20Mix
Libri2Mix
MossFormer2 (w speed perturb)
Libri5Mix
Hungarian PIT
LibriCSS
Conformer (large)
LRS2
TDFNet-small
LRS3
IIANet
TCD-TIMIT corpus (mixed-speech)
VoxCeleb2
RTFS-Net-4
WHAM!
SepReformer-L + DM
WHAMR!
TF-Locoformer (M)
WSJ0-2mix
SepReformer-L
WSJ0-2mix-16k
MossFormer2
WSJ0-3mix
Gated DualPathRNN
WSJ0-4mix
WSJ0-5mix
Gated DualPathRNN