HyperAI
HyperAI超神経
ホーム
プラットフォーム
ドキュメント
ニュース
論文
チュートリアル
データセット
百科事典
SOTA
LLMモデル
GPU ランキング
学会
検索
サイトについて
日本語
HyperAI
HyperAI超神経
Toggle sidebar
サイトを検索…
⌘
K
Command Palette
Search for a command to run...
ホーム
SOTA
音声認識
Speech Recognition On Lrs3 Ted
Speech Recognition On Lrs3 Ted
評価指標
Word Error Rate (WER)
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
Columns
モデル名
Word Error Rate (WER)
Paper Title
Repository
RAVEn Large
1.4
Jointly Learning Visual and Auditory Speech Representations from Raw Data
AV-HuBERT Large
1.3
Learning Audio-Visual Speech Representation by Masked Multimodal Cluster Prediction
Llama-AVSR
0.81
Large Language Models are Strong Audio-Visual Speech Recognition Learners
Whisper
0.68
Whisper-Flamingo: Integrating Visual Features into Whisper for Audio-Visual Speech Recognition and Translation
0 of 4 row(s) selected.
Previous
Next