Spoken Language Identification
Spoken language identification 是语音处理领域的一个子任务,专注于从音频输入中自动识别所使用的语言。该任务旨在通过分析语音信号的声学特征,准确判断说话人使用的具体语言,从而为多语言环境下的语音识别、翻译和交互提供基础支持。其应用价值在于提升跨语言通信的效率和准确性,促进全球化交流。
IndicTTS
KALAKA-3
LRE07
Untranscribed mixed-speech dataset
SVM
VoxForge
LEAF
VoxForge Commonwealth
VoxForge European
VOXLINGUA107
YouTube News dataset (Background Music)
YouTube News dataset (Crackling Noise)
Inception-v3 CRNN
YouTube News dataset (No Noise)
Inception-v3 CRNN
YouTube News dataset (White Noise)
Inception-v3 CRNN