音声分類
音声分類は、音声信号を異なるクラスに認識し、分類する機械学習のタスクです。このタスクの主な目的は、音楽、話し言葉、環境音などのさまざまなタイプの音声を自動的に区別できるようにすることで、音声処理や分析において重要な役割を果たします。正確な音声分類は、音声検索、監視、コンテンツ管理システムの効率と精度を向上させ、重要なアプリケーションとなっています。
AudioSet
MAViL (Audio-Visual, single)
ESC-50
BEATs
ICBHI Respiratory Sound Database
BTS
VGGSound
ONE-PEACE (Audio-Visual)
SHD
SNN with Dilated Convolution with Learnable Spacings
FSD50K
Balanced Audio Set
EquiAV
Speech Commands
EAT
DCASE
CrissCross (AudioSet)
SSC
Event-SSM
BirdCLEF 2021
EPIC-KITCHENS-100
Audiovisual Masked Autoencoder
(Audiovisual, Single)
Audio Set
CREMA-D
DiCOVA
RAVDESS
VocalSound
VocalSound Baseline
DEEP-VOICE: DeepFake Voice Recognition
EPIC-SOUNDS
MeerKAT: Meerkat Kalahari Audio Transcripts
animal2vec
Multimodal PISA
UCR Time Series Classification Archive
CDIL
audiofolder
Common Voice 16.1
LSVSC
MNIST