HyperAIHyperAI

Command Palette

Search for a command to run...

DENet : une architecture profonde pour les applications de surveillance audio

Mario Vento Alessia Saggese Antonio Roberto Antonio Greco

Résumé

Ces dernières années, une forte attention a été portée, tant par la communauté scientifique que par le marché, sur la conception de systèmes d’écoute audio capables d’analyser en continu un flux audio et d’identifier des événements d’intérêt. Ce phénomène est particulièrement marqué dans les applications de sécurité, où l’analyse audio peut être utilisée de manière avantageuse comme alternative aux systèmes d’analyse vidéo, voire combinée avec ceux-ci. Dans ce contexte, nous proposons dans cet article une nouvelle architecture de réseau de neurones récurrents convolutifs, nommée DENet. Elle repose sur une nouvelle couche, que nous appelons couche de débruitage-amélioration (DE), qui effectue le débruitage et l’amélioration du signal original en appliquant une carte d’attention aux composantes du signal filtré par bandes. Contrairement aux méthodologies de pointe actuelles, DENet prend en entrée la forme d’onde brute sans perte et est capable d’apprendre automatiquement l’évolution des fréquences d’intérêt au fil du temps, en combinant la couche proposée avec une unité récurrente à portes bidirectionnelle. Grâce aux rétroactions issues des classifications associées à des trames consécutives (c’est-à-dire appartenant au même événement), la méthode proposée permet de réduire de manière significative les erreurs de classification. Des expériences ont été menées sur les jeux de données publics MIVIA Audio Events et MIVIA Road Events, confirmant l’efficacité de notre approche par rapport aux méthodologies de pointe existantes.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
DENet : une architecture profonde pour les applications de surveillance audio | Articles | HyperAI