HyperAIHyperAI
il y a 16 jours

Convolution dynamique fréquentielle : reconnaissance adaptative des motifs en fréquence pour la détection d’événements sonores

Hyeonuk Nam, Seong-Hu Kim, Byeong-Yun Ko, Yong-Hwa Park
Convolution dynamique fréquentielle : reconnaissance adaptative des motifs en fréquence pour la détection d’événements sonores
Résumé

La convolution 2D est largement utilisée dans la détection d’événements sonores (SED) afin de reconnaître des motifs bidimensionnels temporel-fréquentiels associés aux événements sonores. Toutefois, la convolution 2D impose une équivariance translationnelle aux événements sonores tant selon l’axe temporel que fréquentiel, alors que la dimension fréquentielle n’est pas invariante par translation. Afin d’améliorer la cohérence physique de la convolution 2D dans le cadre de la SED, nous proposons une convolution dynamique fréquentielle, qui utilise des noyaux adaptatifs aux composantes fréquentielles de l’entrée. La convolution dynamique fréquentielle dépasse la méthode de référence de 6,3 % sur le jeu de validation DESED en termes de score de détection sonore polyphonique (PSDS). Elle surpasse également de manière significative d’autres méthodes existantes adaptatives au contenu dans le domaine de la SED. En outre, en comparant les scores F1 par classe entre la méthode de référence et la convolution dynamique fréquentielle, nous démontrons que cette dernière est particulièrement efficace pour la détection des événements sonores non stationnaires présentant des motifs temporel-fréquentiels complexes. Ces résultats confirment que la convolution dynamique fréquentielle excelle dans la reconnaissance de motifs dépendants de la fréquence.

Convolution dynamique fréquentielle : reconnaissance adaptative des motifs en fréquence pour la détection d’événements sonores | Articles de recherche récents | HyperAI