HyperAIHyperAI超神経
ホームニュース論文チュートリアルデータセット百科事典SOTALLMモデルGPU ランキング学会
検索
サイトについて
日本語
HyperAIHyperAI超神経
  1. ホーム
  2. SOTA
  3. 自動音声認識(ASR)
  4. Automatic Speech Recognition On Lrs2

Automatic Speech Recognition On Lrs2

評価指標

Test WER

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

モデル名
Test WER
Paper TitleRepository
TM-CTC10.1Deep Audio-Visual Speech Recognition
LF-MMI TDNN6.7Audio-visual Recognition of Overlapped speech for the LRS2 dataset-
CTC/attention8.2Audio-Visual Speech Recognition With A Hybrid CTC/Attention Architecture-
MoCo + wav2vec (w/o extLM)2.7Leveraging Unimodal Self-Supervised Learning for Multimodal Audio-Visual Speech Recognition
Whisper-LLaMA6.6Whispering LLaMA: A Cross-Modal Generative Error Correction Framework for Speech Recognition
CTC/Attention1.5Auto-AVSR: Audio-Visual Speech Recognition with Automatic Labels
TM-seq2seq9.7Deep Audio-Visual Speech Recognition
Whisper1.3Whisper-Flamingo: Integrating Visual Features into Whisper for Audio-Visual Speech Recognition and Translation
End2end Conformer3.9End-to-end Audio-visual Speech Recognition with Conformers
0 of 9 row(s) selected.
HyperAI

学習、理解、実践、コミュニティと共に人工知能の未来を構築する

日本語

サイトについて

私たちについてデータセットヘルプ

プロダクト

ニュースチュートリアルデータセット百科事典

リンク

TVM 中国語Apache TVMOpenBayes

© HyperAI超神経

TwitterBilibili