HyperAIHyperAI

Command Palette

Search for a command to run...

Convolution dynamique fréquentielle : reconnaissance adaptative des motifs en fréquence pour la détection d’événements sonores

Hyeonuk Nam Seong-Hu Kim Byeong-Yun Ko Yong-Hwa Park

Résumé

La convolution 2D est largement utilisée dans la détection d’événements sonores (SED) afin de reconnaître des motifs bidimensionnels temporel-fréquentiels associés aux événements sonores. Toutefois, la convolution 2D impose une équivariance translationnelle aux événements sonores tant selon l’axe temporel que fréquentiel, alors que la dimension fréquentielle n’est pas invariante par translation. Afin d’améliorer la cohérence physique de la convolution 2D dans le cadre de la SED, nous proposons une convolution dynamique fréquentielle, qui utilise des noyaux adaptatifs aux composantes fréquentielles de l’entrée. La convolution dynamique fréquentielle dépasse la méthode de référence de 6,3 % sur le jeu de validation DESED en termes de score de détection sonore polyphonique (PSDS). Elle surpasse également de manière significative d’autres méthodes existantes adaptatives au contenu dans le domaine de la SED. En outre, en comparant les scores F1 par classe entre la méthode de référence et la convolution dynamique fréquentielle, nous démontrons que cette dernière est particulièrement efficace pour la détection des événements sonores non stationnaires présentant des motifs temporel-fréquentiels complexes. Ces résultats confirment que la convolution dynamique fréquentielle excelle dans la reconnaissance de motifs dépendants de la fréquence.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Convolution dynamique fréquentielle : reconnaissance adaptative des motifs en fréquence pour la détection d’événements sonores | Articles | HyperAI