오디오 분류
오디오 분류는 다양한 클래스로 오디오 신호를 인식하고 분류하는 머신 러닝 작업입니다. 이 작업의 주요 목표는 기계가 음악, 대화, 환경 소리 등 다양한 유형의 오디오를 자동으로 구분할 수 있도록 하는 것입니다. 정확한 오디오 분류는 오디오 검색, 모니터링, 콘텐츠 관리 시스템의 효율성과 정확성을 향상시키는 중요한 역할을 하므로, 매우 중요한 응용 분야입니다.
AudioSet
MAViL (Audio-Visual, single)
ESC-50
BEATs
ICBHI Respiratory Sound Database
BTS
VGGSound
ONE-PEACE (Audio-Visual)
SHD
SNN with Dilated Convolution with Learnable Spacings
FSD50K
Balanced Audio Set
EquiAV
Speech Commands
EAT
DCASE
CrissCross (AudioSet)
SSC
Event-SSM
BirdCLEF 2021
EPIC-KITCHENS-100
Audiovisual Masked Autoencoder
(Audiovisual, Single)
Audio Set
CREMA-D
DiCOVA
RAVDESS
VocalSound
VocalSound Baseline
DEEP-VOICE: DeepFake Voice Recognition
EPIC-SOUNDS
MeerKAT: Meerkat Kalahari Audio Transcripts
animal2vec
Multimodal PISA
UCR Time Series Classification Archive
CDIL
audiofolder
Common Voice 16.1
LSVSC
MNIST