Identification de la langue parlée
L'identification de la langue parlée est une sous-tâche dans le domaine du traitement de la parole qui se concentre sur la reconnaissance automatique de la langue utilisée à partir d'une entrée audio. Cette tâche vise à déterminer avec précision la langue spécifique parlée en analysant les caractéristiques acoustiques des signaux vocaux, offrant ainsi un soutien fondamental à la reconnaissance vocale, à la traduction et à l'interaction dans des environnements multilingues. Sa valeur d'application réside dans l'amélioration de l'efficacité et de la précision de la communication interlinguistique, favorisant les échanges mondiaux.
LRE07
VoxForge European
YouTube News dataset (No Noise)
Inception-v3 CRNN
YouTube News dataset (White Noise)
Inception-v3 CRNN
Untranscribed mixed-speech dataset
SVM
VoxForge Commonwealth
IndicTTS
VoxForge
LEAF
VOXLINGUA107
KALAKA-3
YouTube News dataset (Crackling Noise)
Inception-v3 CRNN
YouTube News dataset (Background Music)