Speech Recognition On Lrs3 Ted
평가 지표
Word Error Rate (WER)
평가 결과
이 벤치마크에서 각 모델의 성능 결과
비교 표
모델 이름 | Word Error Rate (WER) |
---|---|
whisper-flamingo-integrating-visual-features | 0.68 |
jointly-learning-visual-and-auditory-speech | 1.4 |
large-language-models-are-strong-audio-visual | 0.81 |
learning-audio-visual-speech-representation-1 | 1.3 |