HyperAIHyperAI

Command Palette

Search for a command to run...

SepTr : Transformer séparable pour le traitement des spectrogrammes audio

Nicolae-Catalin Ristea Radu Tudor Ionescu Fahad Shahbaz Khan

Résumé

Suite à l’application réussie des transformateurs vision dans diverses tâches de vision par ordinateur, ces modèles ont attiré l’attention de la communauté du traitement du signal. En effet, les signaux sont souvent représentés sous forme de spectrogrammes (par exemple via la transformation de Fourier discrète), qui peuvent être directement utilisés comme entrée pour les transformateurs vision. Toutefois, l’application naïve des transformateurs aux spectrogrammes s’avère sous-optimale. Étant donné que les axes représentent des dimensions distinctes — fréquence et temps — nous proposons qu’une approche plus efficace consiste à séparer l’attention attribuée à chaque axe. À cette fin, nous introduisons l’architecture du Separable Transformer (SepTr), qui utilise deux blocs de transformateurs disposés séquentiellement : le premier s’attache aux tokens appartenant au même intervalle temporel, tandis que le second s’attarde aux tokens situés dans la même bande de fréquence. Nous menons des expériences sur trois jeux de données standardisés, démontrant que notre architecture séparable surpasse les transformateurs vision classiques ainsi que d’autres méthodes de pointe. Contrairement aux transformateurs standards, SepTr fait croître linéairement le nombre de paramètres entraînables en fonction de la taille de l’entrée, ce qui se traduit par une empreinte mémoire réduite. Notre code est disponible en open source à l’adresse suivante : https://github.com/ristea/septr.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp