Speech Enhancement
Sprachtechnologie bezieht sich auf die Fähigkeit von Computersystemen, menschliche Sprache zu verarbeiten, mit dem Ziel der Spracherkennung, -synthese und -verstehens. Ihr Ziel ist es, intelligente Systeme zu entwickeln, die effizient interagieren können und so die Benutzererfahrung verbessern. Sie wird weit verbreitet in virtuellen Assistenten, Kundendienstsystemen, Sprachübersetzungen und anderen Bereichen eingesetzt, was die Natürlichkeit und Bequemlichkeit der Mensch-Computer-Interaktion erheblich fördert.
CHiME-3
Inter-Channel Conv-TasNet
DNS Challenge
ZipEnhancer
(M)
Deep Noise Suppression (DNS) Challenge
FRCRN
VoiceBank + DEMAND
CMGAN
DEMAND
Wave-U-Net
EARS-WHAM
Schrödinger Bridge (PESQ loss)
EasyCom
MaxDI (Baseline)
GRID corpus (mixed-speech)
Audio-Visual concat-ref
LibriSpeechDuplicate
spatialized DNS challenge
DeFT-AN
TCD-TIMIT corpus (mixed-speech)
WHAM!
SepFormer
WHAMR!
WSJ0 + DEMAND + RNNoise
DCUNet-MC