Audio Classification
Audio-Klassifikation ist eine maschinelles Lernverfahren, das darauf abzielt, Audiosignale in verschiedene Kategorien zu erkennen und einzuordnen. Das zentrale Ziel dieser Aufgabe besteht darin, Maschinen zu ermöglichen, automatisch verschiedene Arten von Audio, wie Musik, Sprache und Umgebungsgeräusche, voneinander zu unterscheiden. Dadurch spielt sie eine entscheidende Rolle bei der Audiodatenverarbeitung und -analyse. Eine genaue Audio-Klassifikation kann die Effizienz und Genauigkeit von Audiosuchmaschinen, -überwachungssystemen und Inhaltmanagementsystemen erheblich verbessern, was sie zu einer wichtigen Anwendung macht.
Audio Set
audiofolder
AudioSet
MBT (AS-500K training + Video)
Balanced Audio Set
EAT
BirdCLEF 2021
Common Voice 16.1
CREMA-D
DCASE
CrissCross (AudioSet)
DEEP-VOICE: DeepFake Voice Recognition
DiCOVA
EPIC-KITCHENS-100
Audiovisual Masked Autoencoder
(Audiovisual, Single)
EPIC-SOUNDS
ESC-50
InternVideo2
FSD50K
ICBHI Respiratory Sound Database
BTS
LSVSC
MeerKAT: Meerkat Kalahari Audio Transcripts
animal2vec
MNIST
Multimodal PISA
RAVDESS
SHD
SNN with Dilated Convolution with Learnable Spacings
Speech Commands
EAT
SSC
Event-SSM
UCR Time Series Classification Archive
CDIL
VGGSound
ONE-PEACE (Audio-Visual)
VocalSound
VocalSound Baseline