HyperAI超神経

Speech Recognition On Lrs3 Ted

評価指標

Word Error Rate (WER)

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名Word Error Rate (WER)
whisper-flamingo-integrating-visual-features0.68
jointly-learning-visual-and-auditory-speech1.4
large-language-models-are-strong-audio-visual0.81
learning-audio-visual-speech-representation-11.3