HyperAIHyperAI

Command Palette

Search for a command to run...

VGG-SS-Datensatz Zur Schallquellenlokalisierung

Datum

vor 3 Jahren

Organisation

Universität Oxford

Veröffentlichungs-URL

www.robots.ox.ac.uk

Paper-URL

arxiv.org

Lizenz

Andere

Treten Sie der Discord-Community bei
Featured Image

VGG-SS steht für VGG Sound Source, ein Videodatensatz zur Auswertung der Schallquellenlokalisierung. Der Datensatz enthält mehr als 200 Kategorien, 5.000 Videos und neue Anmerkungen des VGG-Sound-Datensatzes und ist damit zehnmal größer als vorhandene Datensätze. Sichtbare Tonquellen in jedem Videoclip sind deutlich mit Begrenzungsrahmen gekennzeichnet. Anders als bei Flickr SoundNet basiert die Lokalisierung der Tonquelle in diesem Datensatz auf Videos.

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp