HyperAIHyperAI

Command Palette

Search for a command to run...

VGG-SS-Datensatz Zur Schallquellenlokalisierung

Auf Discord diskutieren

Datum

vor 3 Jahren

Organisation

Universität Oxford

Veröffentlichungs-URL

www.robots.ox.ac.uk

Paper-URL

arxiv.org

Lizenz

Other

Featured Image

VGG-SS steht für VGG Sound Source, ein Videodatensatz zur Auswertung der Schallquellenlokalisierung. Der Datensatz enthält mehr als 200 Kategorien, 5.000 Videos und neue Anmerkungen des VGG-Sound-Datensatzes und ist damit zehnmal größer als vorhandene Datensätze. Sichtbare Tonquellen in jedem Videoclip sind deutlich mit Begrenzungsrahmen gekennzeichnet. Anders als bei Flickr SoundNet basiert die Lokalisierung der Tonquelle in diesem Datensatz auf Videos.

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp