il y a 3 mois

Résumé

Nous présentons Step-Audio-EditX, le premier modèle audio open source basé sur un grand modèle linguistique (LLM) offrant des performances exceptionnelles dans l’édition audio expressive et itérative, couvrant l’émotion, le style d’élocution et les aspects paralinguistiques, tout en disposant de capacités robustes de synthèse vocale à partir de texte (TTS) en zero-shot. Notre innovation centrale réside dans l’utilisation exclusive de données synthétiques à grand écart (large-margin), ce qui élimine la nécessité de recourir à des priori basés sur des embeddings ou à des modules auxiliaires. Cette approche d’apprentissage à grand écart permet à la fois un contrôle itératif et une grande expressivité à travers diverses voix, marquant un tournant fondamental par rapport à l’approche classique axée sur le découplage au niveau de la représentation. Les résultats d’évaluation montrent que Step-Audio-EditX surpasse à la fois MiniMax-2.6-hd et Doubao-Seed-TTS-2.0 en édition émotionnelle et dans d’autres tâches de contrôle fine.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

il y a 3 mois

Chao Yan Boyong Wu Peng Yang Pengfei Tan Guoqiang Hu Yuxin Zhang Xiangyu Zhang Fei Tian Xuerui Yang

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

il y a 3 mois

Chao Yan Boyong Wu Peng Yang Pengfei Tan Guoqiang Hu Yuxin Zhang Xiangyu Zhang Fei Tian Xuerui Yang

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Rapport technique de Step-Audio-EditX | Articles | HyperAI

Command Palette

Rapport technique de Step-Audio-EditX

Chao Yan Boyong Wu Peng Yang Pengfei Tan Guoqiang Hu Yuxin Zhang Xiangyu Zhang Fei Tian Xuerui Yang3 more

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Rapport technique de Step-Audio-EditX

Chao Yan Boyong Wu Peng Yang Pengfei Tan Guoqiang Hu Yuxin Zhang Xiangyu Zhang Fei Tian Xuerui Yang3 more

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Rapport technique de Step-Audio-EditX

Chao Yan Boyong Wu Peng Yang Pengfei Tan Guoqiang Hu Yuxin Zhang Xiangyu Zhang Fei Tian Xuerui Yang3 more

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Chao Yan Boyong Wu Peng Yang Pengfei Tan Guoqiang Hu Yuxin Zhang Xiangyu Zhang Fei Tian Xuerui Yang

Chao Yan Boyong Wu Peng Yang Pengfei Tan Guoqiang Hu Yuxin Zhang Xiangyu Zhang Fei Tian Xuerui Yang

Chao Yan Boyong Wu Peng Yang Pengfei Tan Guoqiang Hu Yuxin Zhang Xiangyu Zhang Fei Tian Xuerui Yang