Spoken Language Identification
音声技術とは、コンピュータシステムが人間の音声を処理し、音声認識、合成、理解を実現する能力のことを指します。この技術の目的は、効率的な相互作用を可能にし、ユーザーエクスペリエンスを向上させる知能システムを構築することです。音声技術は、バーチャルアシスタント、カスタマーサービスシステム、音声翻訳など、さまざまな分野で広く応用されており、人間とコンピュータの自然で便利な相互作用を大幅に促進しています。
IndicTTS
KALAKA-3
LRE07
Untranscribed mixed-speech dataset
SVM
VoxForge
LEAF
VoxForge Commonwealth
VoxForge European
VOXLINGUA107
YouTube News dataset (Background Music)
YouTube News dataset (Crackling Noise)
Inception-v3 CRNN
YouTube News dataset (No Noise)
Inception-v3 CRNN
YouTube News dataset (White Noise)
Inception-v3 CRNN