Sprachidentifikation
Die Sprachidentifikation ist eine Teilbereich der Sprachverarbeitung, die sich auf die automatische Erkennung der verwendeten Sprache aus Audioeingaben konzentriert. Das Ziel besteht darin, die genaue Sprache zu bestimmen, indem die akustischen Merkmale von Sprachsignalen analysiert werden. Dies bietet grundlegende Unterstützung für die Spracherkennung, Übersetzung und Interaktion in mehrsprachigen Umgebungen. Der Anwendungswert liegt in der Steigerung der Effizienz und Genauigkeit des grenzüberschreitenden Kommunikationsprozesses sowie im Fördern des globalen Austauschs.
LRE07
VoxForge European
YouTube News dataset (No Noise)
Inception-v3 CRNN
YouTube News dataset (White Noise)
Inception-v3 CRNN
Untranscribed mixed-speech dataset
SVM
VoxForge Commonwealth
IndicTTS
VoxForge
LEAF
VOXLINGUA107
KALAKA-3
YouTube News dataset (Crackling Noise)
Inception-v3 CRNN
YouTube News dataset (Background Music)