HyperAI초신경

홈 플랫폼 문서 뉴스 연구 논문 튜토리얼 데이터셋 백과사전 SOTA LLM 모델 GPU 랭킹 컨퍼런스

한국어

HyperAI초신경

Speech Recognition On Common Voice Spanish

평가 지표

Test WER

평가 결과

이 벤치마크에서 각 모델의 성능 결과

		Paper Title	Repository
QuartzNet15x5ES (CV-only)	10.5%	Scribosermo: Fast Speech-to-Text models for German and other Languages
VoxPopuli-50K (n-gram)	10.0%	VoxPopuli: A Large-Scale Multilingual Speech Corpus for Representation Learning, Semi-Supervised Learning and Interpretation
QuartzNet15x5ES (D8)	10.0%	Scribosermo: Fast Speech-to-Text models for German and other Languages
ConformerCTC-L (no-LM)	7.46 %	Scribosermo: Fast Speech-to-Text models for German and other Languages
ConformerCTC-L (no LM)	6.9%	NeMo: a toolkit for building AI applications using Neural Modules
ConformerCTC-L (5-gram)	5.68%	Scribosermo: Fast Speech-to-Text models for German and other Languages
Whisper (Large v2)	5.6%	Robust Speech Recognition via Large-Scale Weak Supervision
ConformerCTC-L (4-gram)	5.5%	NeMo: a toolkit for building AI applications using Neural Modules

0 of 8 row(s) selected.