il y a 3 mois

Résumé

L’étiquette de « bout en bout » (end-to-end) appliquée aux grands modèles linguistiques (LLM) est trompeuse. En pratique, ces modèles reposent sur un processus de décodage non différentiable, qui exige un réglage manuel fastidieux de hyperparamètres tels que la température ou top-p. Ce papier présente AutoDeco, une nouvelle architecture qui permet une génération véritablement « bout en bout » en apprenant à contrôler sa propre stratégie de décodage. Nous enrichissons le modèle Transformer standard par des têtes légères qui, à chaque étape, prédise de manière dynamique, en fonction du contexte, les valeurs de température et de top-p, en parallèle avec les logits du prochain mot. Cette approche transforme le décodage en un processus paramétrique et au niveau du token, permettant au modèle de réguler automatiquement sa stratégie d’échantillonnage en une seule passe avant. Grâce à des expérimentations étendues sur huit benchmarks, nous montrons qu’AutoDeco surpasse non seulement de manière significative les stratégies de décodage par défaut, mais atteint également une performance comparable à celle d’une base oracle-tunée obtenue par « piratage du jeu de test » — une borne supérieure pratique pour toute méthode statique. De façon cruciale, nous mettons en évidence une capacité émergente de contrôle du décodage par instruction : le modèle apprend à interpréter des commandes en langage naturel (par exemple, « générez avec faible aléatoire ») et ajuste, mot par mot, les valeurs prédites de température et de top-p, ouvrant ainsi une nouvelle voie pour le décodage des LLM pilotable et interactif.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

il y a 3 mois

Traitement Du Langage Naturel

Tâche

Zhichao Wang Dongyang Ma Xinting Huang Deng Cai Tian Lan Jiahao Xu Haitao Mi Xiaoying Tang Yan Wang

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

il y a 3 mois

Traitement Du Langage Naturel

Tâche

Zhichao Wang Dongyang Ma Xinting Huang Deng Cai Tian Lan Jiahao Xu Haitao Mi Xiaoying Tang Yan Wang

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

La fin du décodage manuel : vers des modèles linguistiques véritablement end-to-end | Articles | HyperAI

Command Palette

La fin du décodage manuel : vers des modèles linguistiques véritablement end-to-end

Zhichao Wang Dongyang Ma Xinting Huang Deng Cai Tian Lan Jiahao Xu Haitao Mi Xiaoying Tang Yan Wang

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

La fin du décodage manuel : vers des modèles linguistiques véritablement end-to-end

Zhichao Wang Dongyang Ma Xinting Huang Deng Cai Tian Lan Jiahao Xu Haitao Mi Xiaoying Tang Yan Wang

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

La fin du décodage manuel : vers des modèles linguistiques véritablement end-to-end

Zhichao Wang Dongyang Ma Xinting Huang Deng Cai Tian Lan Jiahao Xu Haitao Mi Xiaoying Tang Yan Wang

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters