HyperAI
HyperAI초신경
홈
플랫폼
문서
뉴스
연구 논문
튜토리얼
데이터셋
백과사전
SOTA
LLM 모델
GPU 랭킹
컨퍼런스
전체 검색
소개
한국어
HyperAI
HyperAI초신경
Toggle sidebar
전체 사이트 검색...
⌘
K
Command Palette
Search for a command to run...
홈
SOTA
음성 인식
Speech Recognition On Lrs3 Ted
Speech Recognition On Lrs3 Ted
평가 지표
Word Error Rate (WER)
평가 결과
이 벤치마크에서 각 모델의 성능 결과
Columns
모델 이름
Word Error Rate (WER)
Paper Title
Repository
RAVEn Large
1.4
Jointly Learning Visual and Auditory Speech Representations from Raw Data
AV-HuBERT Large
1.3
Learning Audio-Visual Speech Representation by Masked Multimodal Cluster Prediction
Llama-AVSR
0.81
Large Language Models are Strong Audio-Visual Speech Recognition Learners
Whisper
0.68
Whisper-Flamingo: Integrating Visual Features into Whisper for Audio-Visual Speech Recognition and Translation
0 of 4 row(s) selected.
Previous
Next