il y a 4 mois

Qinglin Zhu Yizhen Yao Runcong Zhao Yanzheng Xiang Amrutha Saseendran Chen Jin Philip Alexander Teare Bin Liang Yulan He Lin Gui

Résumé

Les modèles autorégressifs (AR) restent la norme pour la génération de langage naturel, mais ils souffrent encore d’une latence élevée en raison du décodage strictement séquentiel. Les approches récentes inspirées des modèles de diffusion, telles que LlaDA et Dream, atténuent ce problème en générant en parallèle, mais elles présentent deux limitations fondamentales : une perte d’information, puisque les distributions prédictives des jetons non finalisés sont rejetées à chaque étape, et un engagement prématuré, où des décisions locales sont prises sans coordination globale suffisante. Nous proposons Latent Refinement Decoding (LRD), un cadre en deux étapes comprenant une phase de raffinement latent et une boucle de rétroaction prédictive. La première étape conserve les positions masquées sous la forme de mélanges distributionnels de jetons prédits et d’un embedding de masque, permettant au modèle d’établir des croyances plus cohérentes au niveau global. La deuxième étape finalise progressivement les jetons dont la confiance est élevée, tout en conservant les incertains pour une rétroaction itérative. La dynamique de divergence de Kullback-Leibler (KL) fournit un critère rigoureux et fiable pour la convergence et l’arrêt anticipé. Des expériences menées sur des tâches de codage (HumanEval +6,3, MBPP +2,6) et de raisonnement (GSM8K +2,9, MATH500 +3,8) montrent que LRD améliore l’exactitude tout en offrant des accélérations allant jusqu’à 10,6×, ce qui en fait une alternative puissante et polyvalente pour la génération parallèle de séquences.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

il y a 4 mois

Traitement Du Langage Naturel

Tâche

Qinglin Zhu Yizhen Yao Runcong Zhao Yanzheng Xiang Amrutha Saseendran Chen Jin Philip Alexander Teare Bin Liang Yulan He Lin Gui

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

il y a 4 mois

Traitement Du Langage Naturel

Tâche

Qinglin Zhu Yizhen Yao Runcong Zhao Yanzheng Xiang Amrutha Saseendran Chen Jin Philip Alexander Teare Bin Liang Yulan He Lin Gui

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Décodage de raffinement latent : amélioration des modèles linguistiques basés sur les diffusions par le raffinement des états de croyance

Qinglin Zhu Yizhen Yao Runcong Zhao Yanzheng Xiang Amrutha Saseendran Chen Jin Philip Alexander Teare Bin Liang Yulan He Lin Gui

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Décodage de raffinement latent : amélioration des modèles linguistiques basés sur les diffusions par le raffinement des états de croyance

Qinglin Zhu Yizhen Yao Runcong Zhao Yanzheng Xiang Amrutha Saseendran Chen Jin Philip Alexander Teare Bin Liang Yulan He Lin Gui

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Décodage de raffinement latent : amélioration des modèles linguistiques basés sur les diffusions par le raffinement des états de croyance

Qinglin Zhu Yizhen Yao Runcong Zhao Yanzheng Xiang Amrutha Saseendran Chen Jin Philip Alexander Teare Bin Liang Yulan He Lin Gui

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters