vor 8 Monaten

Zusammenfassung

Wir schlagen ein Zweiströmnnetzwerk mit Faltungsoperationen für die Audioerkennung vor, das auf Zeit-Frequenz-Spektrogrammeingaben arbeitet. In Anlehnung an ähnliche Erfolge im Bereich der visuellen Erkennung lernen wir langsame und schnelle auditive Ströme mit trennbaren Faltungen und mehrstufigen lateralen Verbindungen. Der langsame Pfad verfügt über eine hohe Kanalkapazität, während der schnelle Pfad eine feingranulare zeitliche Auflösung aufweist. Wir demonstrieren die Bedeutung unseres Zweiströmvorschlags anhand von zwei verschiedenen Datensätzen: VGG-Sound und EPIC-KITCHENS-100 und erzielen bei beiden den aktuellen Stand der Technik (state-of-the-art results).

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 8 Monaten

Spracherkennung

Faltungsneuronales Netzwerk

Audio- Und Sprachverarbeitung

Ansatz/Rahmenwerk

Audio

Aufgabe

Evangelos Kazakos Arsha Nagrani Andrew Zisserman Dima Damen

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Langsame und schnelle auditive Ströme für die Audioerkennung | Paper | HyperAI

Command Palette

Langsame und schnelle auditive Ströme für die Audioerkennung

Evangelos Kazakos Arsha Nagrani Andrew Zisserman Dima Damen

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Langsame und schnelle auditive Ströme für die Audioerkennung

Evangelos Kazakos Arsha Nagrani Andrew Zisserman Dima Damen

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Langsame und schnelle auditive Ströme für die Audioerkennung

Evangelos Kazakos Arsha Nagrani Andrew Zisserman Dima Damen

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters