Spoken Language Identification
L'identification de la langue parlée est une sous-tâche dans le domaine du traitement de la parole qui se concentre sur la reconnaissance automatique de la langue utilisée à partir d'une entrée audio. Cette tâche vise à déterminer avec précision la langue spécifique parlée en analysant les caractéristiques acoustiques des signaux vocaux, offrant ainsi un soutien fondamental à la reconnaissance vocale, à la traduction et à l'interaction dans des environnements multilingues. Sa valeur d'application réside dans l'amélioration de l'efficacité et de la précision de la communication interlinguistique, favorisant les échanges mondiaux.
IndicTTS
KALAKA-3
LRE07
Untranscribed mixed-speech dataset
SVM
VoxForge
LEAF
VoxForge Commonwealth
VoxForge European
VOXLINGUA107
YouTube News dataset (Background Music)
YouTube News dataset (Crackling Noise)
Inception-v3 CRNN
YouTube News dataset (No Noise)
Inception-v3 CRNN
YouTube News dataset (White Noise)
Inception-v3 CRNN