HyperAI

Speech Recognition On Lrs3 Ted

Métriques

Word Error Rate (WER)

Résultats

Résultats de performance de divers modèles sur ce benchmark

Tableau comparatif
Nom du modèleWord Error Rate (WER)
whisper-flamingo-integrating-visual-features0.68
jointly-learning-visual-and-auditory-speech1.4
large-language-models-are-strong-audio-visual0.81
learning-audio-visual-speech-representation-11.3