Audio-Klassifikation
Audio-Klassifikation ist eine maschinelles Lernverfahren, das darauf abzielt, Audiosignale in verschiedene Kategorien zu erkennen und einzuordnen. Das zentrale Ziel dieser Aufgabe besteht darin, Maschinen zu ermöglichen, automatisch verschiedene Arten von Audio, wie Musik, Sprache und Umgebungsgeräusche, voneinander zu unterscheiden. Dadurch spielt sie eine entscheidende Rolle bei der Audiodatenverarbeitung und -analyse. Eine genaue Audio-Klassifikation kann die Effizienz und Genauigkeit von Audiosuchmaschinen, -überwachungssystemen und Inhaltmanagementsystemen erheblich verbessern, was sie zu einer wichtigen Anwendung macht.
AudioSet
MAViL (Audio-Visual, single)
ESC-50
BEATs
ICBHI Respiratory Sound Database
BTS
VGGSound
ONE-PEACE (Audio-Visual)
SHD
SNN with Dilated Convolution with Learnable Spacings
FSD50K
Balanced Audio Set
EquiAV
Speech Commands
EAT
DCASE
CrissCross (AudioSet)
SSC
Event-SSM
BirdCLEF 2021
EPIC-KITCHENS-100
Audiovisual Masked Autoencoder
(Audiovisual, Single)
Audio Set
CREMA-D
DiCOVA
RAVDESS
VocalSound
VocalSound Baseline
DEEP-VOICE: DeepFake Voice Recognition
EPIC-SOUNDS
MeerKAT: Meerkat Kalahari Audio Transcripts
animal2vec
Multimodal PISA
UCR Time Series Classification Archive
CDIL
audiofolder
Common Voice 16.1
LSVSC
MNIST