HyperAI

Die Sprachidentifikation ist eine Teilbereich der Sprachverarbeitung, die sich auf die automatische Erkennung der verwendeten Sprache aus Audioeingaben konzentriert. Das Ziel besteht darin, die genaue Sprache zu bestimmen, indem die akustischen Merkmale von Sprachsignalen analysiert werden. Dies bietet grundlegende Unterstützung für die Spracherkennung, Übersetzung und Interaktion in mehrsprachigen Umgebungen. Der Anwendungswert liegt in der Steigerung der Effizienz und Genauigkeit des grenzüberschreitenden Kommunikationsprozesses sowie im Fördern des globalen Austauschs.

LRE07

VoxForge European

YouTube News dataset (No Noise)

Inception-v3 CRNN

YouTube News dataset (White Noise)

Inception-v3 CRNN

Untranscribed mixed-speech dataset

SVM

VoxForge Commonwealth

IndicTTS

VoxForge

LEAF