HyperAI초신경

홈 뉴스 연구 논문 튜토리얼 데이터셋 백과사전 SOTA LLM 모델 GPU 랭킹 컨퍼런스

한국어

HyperAI초신경

Automatic Lyrics Transcription On Jam Alt 4

평가 지표

Case Error Rate

Line break F-1

Punctuation F-1

Word Error Rate (WER)

평가 결과

이 벤치마크에서 각 모델의 성능 결과

모델 이름	Case Error Rate	Line break F-1	Punctuation F-1	Word Error Rate (WER)	Paper Title	Repository
Whisper v2 +demucs	3.2	66.1	34.9	43.3	Jam-ALT: A Formatting-Aware Lyrics Transcription Benchmark
Whisper v2	-	73.4	45.9	27.7	Lyrics Transcription for Humans: A Readability-Aware Benchmark
Whisper v2 +lang	-	73.7	45.3	27.1	Lyrics Transcription for Humans: A Readability-Aware Benchmark
AudioShake v1	2.0	84.9	45.8	34.9	Jam-ALT: A Formatting-Aware Lyrics Transcription Benchmark
Whisper v3 +demucs	3.2	69.4	30.9	44.9	Jam-ALT: A Formatting-Aware Lyrics Transcription Benchmark
Whisper v2	3.2	73.4	45.8	27.7	Jam-ALT: A Formatting-Aware Lyrics Transcription Benchmark
Whisper v2 +demucs +lang	-	65.6	36.1	38.2	Lyrics Transcription for Humans: A Readability-Aware Benchmark
Whisper v3	3.3	77.8	42.4	34.7	Jam-ALT: A Formatting-Aware Lyrics Transcription Benchmark
Whisper v3 +lang	-	77.9	42.3	34.7	Lyrics Transcription for Humans: A Readability-Aware Benchmark
Whisper v3 +demucs	-	69.3	32.0	44.9	Lyrics Transcription for Humans: A Readability-Aware Benchmark
Whisper v3	-	77.9	42.5	34.7	Lyrics Transcription for Humans: A Readability-Aware Benchmark
OWSM v3.1 +lang	-	36.0	30.6	71.6	Lyrics Transcription for Humans: A Readability-Aware Benchmark
OWSM v3.1 +demucs +lang	-	40.9	22.3	78.5	Lyrics Transcription for Humans: A Readability-Aware Benchmark
Whisper v3 +demucs +lang	-	69.3	32.0	44.9	Lyrics Transcription for Humans: A Readability-Aware Benchmark
Whisper v2 +demucs	-	66.0	38.0	43.3	Lyrics Transcription for Humans: A Readability-Aware Benchmark
AudioShake v3	-	88.6	46.1	20.8	Lyrics Transcription for Humans: A Readability-Aware Benchmark

0 of 16 row(s) selected.