Speech Recognition On Lrs3 Ted
評価指標
Word Error Rate (WER)
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
比較表
モデル名 | Word Error Rate (WER) |
---|---|
whisper-flamingo-integrating-visual-features | 0.68 |
jointly-learning-visual-and-auditory-speech | 1.4 |
large-language-models-are-strong-audio-visual | 0.81 |
learning-audio-visual-speech-representation-1 | 1.3 |