HyperAIHyperAI

Command Palette

Search for a command to run...

il y a 21 jours

Décodage de raffinement latent : amélioration des modèles linguistiques basés sur les diffusions par le raffinement des états de croyance

Qinglin Zhu Yizhen Yao Runcong Zhao Yanzheng Xiang Amrutha Saseendran Chen Jin Philip Alexander Teare Bin Liang Yulan He Lin Gui

Décodage de raffinement latent : amélioration des modèles linguistiques basés sur les diffusions par le raffinement des états de croyance

Résumé

Les modèles autorégressifs (AR) restent la norme pour la génération de langage naturel, mais ils souffrent encore d’une latence élevée en raison du décodage strictement séquentiel. Les approches récentes inspirées des modèles de diffusion, telles que LlaDA et Dream, atténuent ce problème en générant en parallèle, mais elles présentent deux limitations fondamentales : une perte d’information, puisque les distributions prédictives des jetons non finalisés sont rejetées à chaque étape, et un engagement prématuré, où des décisions locales sont prises sans coordination globale suffisante. Nous proposons Latent Refinement Decoding (LRD), un cadre en deux étapes comprenant une phase de raffinement latent et une boucle de rétroaction prédictive. La première étape conserve les positions masquées sous la forme de mélanges distributionnels de jetons prédits et d’un embedding de masque, permettant au modèle d’établir des croyances plus cohérentes au niveau global. La deuxième étape finalise progressivement les jetons dont la confiance est élevée, tout en conservant les incertains pour une rétroaction itérative. La dynamique de divergence de Kullback-Leibler (KL) fournit un critère rigoureux et fiable pour la convergence et l’arrêt anticipé. Des expériences menées sur des tâches de codage (HumanEval +6,3, MBPP +2,6) et de raisonnement (GSM8K +2,9, MATH500 +3,8) montrent que LRD améliore l’exactitude tout en offrant des accélérations allant jusqu’à 10,6×, ce qui en fait une alternative puissante et polyvalente pour la génération parallèle de séquences.

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Décodage de raffinement latent : amélioration des modèles linguistiques basés sur les diffusions par le raffinement des états de croyance | Articles de recherche | HyperAI