Audio Classification
音声分類は、音声信号を異なるクラスに認識し、分類する機械学習のタスクです。このタスクの主な目的は、音楽、話し言葉、環境音などのさまざまなタイプの音声を自動的に区別できるようにすることで、音声処理や分析において重要な役割を果たします。正確な音声分類は、音声検索、監視、コンテンツ管理システムの効率と精度を向上させ、重要なアプリケーションとなっています。
Audio Set
audiofolder
AudioSet
MBT (AS-500K training + Video)
Balanced Audio Set
EAT
BirdCLEF 2021
Common Voice 16.1
CREMA-D
DCASE
CrissCross (AudioSet)
DEEP-VOICE: DeepFake Voice Recognition
DiCOVA
EPIC-KITCHENS-100
Audiovisual Masked Autoencoder
(Audiovisual, Single)
EPIC-SOUNDS
ESC-50
InternVideo2
FSD50K
ICBHI Respiratory Sound Database
BTS
LSVSC
MeerKAT: Meerkat Kalahari Audio Transcripts
animal2vec
MNIST
Multimodal PISA
RAVDESS
SHD
SNN with Dilated Convolution with Learnable Spacings
Speech Commands
EAT
SSC
Event-SSM
UCR Time Series Classification Archive
CDIL
VGGSound
ONE-PEACE (Audio-Visual)
VocalSound
VocalSound Baseline