Speech Recognition On Lrs3 Ted
Métriques
Word Error Rate (WER)
Résultats
Résultats de performance de divers modèles sur ce benchmark
Tableau comparatif
Nom du modèle | Word Error Rate (WER) |
---|---|
whisper-flamingo-integrating-visual-features | 0.68 |
jointly-learning-visual-and-auditory-speech | 1.4 |
large-language-models-are-strong-audio-visual | 0.81 |
learning-audio-visual-speech-representation-1 | 1.3 |