음성 향상
음성 향상은 시끄럽거나 환경이 열악한 상황에서 캡처된 음성 신호의 품질을 개선하는 신호 처리 작업입니다. 이 작업의 목표는 음성 신호를 더 명확하고, 이해하기 쉽고, 듣기 좋게 만드는 것입니다. 음성 인식, 화상 회의, 청각 보조기기 등 다양한 분야에서 응용됩니다. 대표적인 프로젝트인 ClearerVoice-Studio는 온라인 데모를 제공합니다.
VoiceBank + DEMAND
real-time-GRU
Deep Noise Suppression (DNS) Challenge
FRCRN
CHiME-3
Inter-Channel Conv-TasNet
EARS-WHAM
Schrödinger Bridge (PESQ loss)
EasyCom
MaxDI (Baseline)
DNS Challenge
ZipEnhancer
(M)
WHAMR!
WSJ0 + DEMAND + RNNoise
DCUNet-MC
DEMAND
Wave-U-Net
GRID corpus (mixed-speech)
Audio-Visual concat-ref
LibriSpeechDuplicate
spatialized DNS challenge
DeFT-AN
TCD-TIMIT corpus (mixed-speech)
WHAM!
SepFormer