Speech Enhancement
음성 기술은 컴퓨터 시스템이 인간의 음성을 처리하여 음성 인식, 합성, 및 이해를 달성하는 능력을 말합니다. 이 기술의 목표는 사용자 경험을 향상시키며 효율적으로 상호작용할 수 있는 지능형 시스템을 구축하는 것입니다. 음성 기술은 가상 비서, 고객 서비스 시스템, 음성 번역 등 다양한 분야에서 널리 활용되며, 인간과 컴퓨터 간의 상호작용을 더욱 자연스럽고 편리하게 만드는 데 크게 기여하고 있습니다.
CHiME-3
Inter-Channel Conv-TasNet
DNS Challenge
ZipEnhancer
(M)
Deep Noise Suppression (DNS) Challenge
FRCRN
VoiceBank + DEMAND
CMGAN
DEMAND
Wave-U-Net
EARS-WHAM
Schrödinger Bridge (PESQ loss)
EasyCom
MaxDI (Baseline)
GRID corpus (mixed-speech)
Audio-Visual concat-ref
LibriSpeechDuplicate
spatialized DNS challenge
DeFT-AN
TCD-TIMIT corpus (mixed-speech)
WHAM!
SepFormer
WHAMR!
WSJ0 + DEMAND + RNNoise
DCUNet-MC