HyperAIHyperAI

Command Palette

Search for a command to run...

EVA-GAN : Génération améliorée de diverses audios par réseaux antagonistes génératifs évolutifs

Shijia Liao Shiyi Lan Arun George Zachariah

Résumé

L’arrivée des grands modèles marque une nouvelle ère dans l’apprentissage automatique, dépassant significativement les modèles plus petits grâce à l’exploitation de jeux de données massifs afin de capturer et de synthétiser des motifs complexes. Malgré ces progrès, l’exploration du dimensionnement, en particulier dans le domaine de la génération audio, reste limitée : les travaux antérieurs n’ont pas atteint le domaine haute fidélité (HiFi) à 44,1 kHz, et souffrent à la fois de discontinuités spectrales et d’flou dans le domaine des hautes fréquences, tout en manquant de robustesse face aux données hors domaine. Ces limitations restreignent l’application des modèles à des cas d’utilisation variés, notamment la génération de musique et de chant. Notre travail présente EVA-GAN (Enhanced Various Audio Generation via Scalable Generative Adversarial Networks), un modèle qui apporte des améliorations significatives par rapport aux états de l’art précédents en termes de reconstruction spectrale et des hautes fréquences, ainsi qu’en robustesse face aux données hors domaine. Il permet la génération d’audio haute fidélité en exploitant un jeu de données étendu de 36 000 heures d’audio à 44,1 kHz, un module conscient du contexte, un outil d’évaluation des artefacts basé sur une interaction humaine (Human-In-The-Loop), et en élargissant le modèle à environ 200 millions de paramètres. Des démonstrations de notre travail sont disponibles à l’adresse suivante : https://double-blind-eva-gan.cc.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp