음성인식 변환
음성-텍스트 번역은 자연어 처리 분야에서 중요한 하위 작업으로, 한 언어의 음성 신호를 다른 언어의 텍스트 형태로 변환하는 것을 목표로 합니다. 이 작업은 단계별 방법이나 종단 간 방법을 통해 이루어질 수 있으며, 주요 목표는 언어 간 의사소통의 효율성과 정확성을 향상시키는 것입니다. 이 기술은 다국어 회의 녹취, 국제 전화 통화 녹취, 온라인 교육, 원격 의료 등 다양한 시나리오에서 널리 활용되며, 실제 응용 측면에서 매우 가치가 높습니다.
MuST-C EN->DE
Task Modulation + Multitask Learning(ASR/MT) + Data Augmentation
MuST-C EN->ES
Dual-decoder Transformer
MuST-C EN->FR
Dual-decoder Transformer
CoVoST 2 eng-X
CoVoST 2 X-eng
FLEURS eng-X
FLEURS X-eng
libri-trans
Transformer + ASR Pretrain + SpecAug
MuST-C
Transformer with Adapters
MuST-C EN->NL
Speechformer