Spoken Language Identification
Die Sprachidentifikation ist eine Teilbereich der Sprachverarbeitung, die sich auf die automatische Erkennung der verwendeten Sprache aus Audioeingaben konzentriert. Das Ziel besteht darin, die genaue Sprache zu bestimmen, indem die akustischen Merkmale von Sprachsignalen analysiert werden. Dies bietet grundlegende Unterstützung für die Spracherkennung, Übersetzung und Interaktion in mehrsprachigen Umgebungen. Der Anwendungswert liegt in der Steigerung der Effizienz und Genauigkeit des grenzüberschreitenden Kommunikationsprozesses sowie im Fördern des globalen Austauschs.
IndicTTS
KALAKA-3
LRE07
Untranscribed mixed-speech dataset
SVM
VoxForge
LEAF
VoxForge Commonwealth
VoxForge European
VOXLINGUA107
YouTube News dataset (Background Music)
YouTube News dataset (Crackling Noise)
Inception-v3 CRNN
YouTube News dataset (No Noise)
Inception-v3 CRNN
YouTube News dataset (White Noise)
Inception-v3 CRNN