HyperAIHyperAI

Command Palette

Search for a command to run...

Voice2Series : Réprogrammation des modèles acoustiques pour la classification des séries temporelles

Chao-Han Huck Yang Yun-Yun Tsai Pin-Yu Chen

Résumé

Apprendre à classifier des séries temporelles avec des données limitées est un problème pratique mais difficile. Les méthodes actuelles reposent principalement sur des règles de extraction de caractéristiques conçues à la main ou sur une augmentation de données spécifique au domaine. Motivés par les progrès réalisés dans les modèles de traitement du discours profond et par le fait que les données vocales constituent des signaux temporels univariés, nous proposons dans cet article Voice2Series (V2S), une nouvelle approche end-to-end qui réutilise les modèles acoustiques pour la classification des séries temporelles, grâce à l’apprentissage de transformations d’entrée et à une cartographie des étiquettes de sortie. En exploitant la puissance d’apprentissage de représentations d’un grand modèle préentraîné de traitement du discours, nous montrons sur 30 tâches différentes de classification de séries temporelles que V2S obtient des résultats compétitifs sur 19 de ces tâches. Nous fournissons également une justification théorique de V2S en démontrant que son risque de population est borné supérieur par le risque source et une distance de Wasserstein tenant compte de l’alignement des caractéristiques via la réprogrammation. Nos résultats offrent de nouvelles voies efficaces pour la classification des séries temporelles.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp