Command Palette
Search for a command to run...
DiffuCode-7B-cpGRPO : Un Modèle De Génération De Code Basé Sur La Technologie De Diffusion De Masque
Date
Size
12.8 MB
License
Other
GitHub
Paper URL

1. Introduction au tutoriel

DiffuCoder-7B-cpGRPO, initialement proposé par l'équipe d'Apple dans un article publié le 25 juin 2025, est un modèle de génération de code basé sur la diffusion masquée (dLLM). Il a été entraîné sur plus de 20 000 exemples de code soigneusement sélectionnés. Ce modèle vise à générer et à modifier du code par réduction itérative du bruit, contrairement à la génération autorégressive traditionnelle de gauche à droite. Une caractéristique importante de DiffuCoder-7B-cpGRPO est sa capacité à ne pas dépendre strictement de la génération de gauche à droite, ce qui lui a permis d'obtenir un gain de 4,41 points TP3T sur les principaux benchmarks de programmation par rapport aux autres modèles de programmation basés sur la diffusion. Cette capacité de génération de code non séquentielle le rend plus flexible et plus efficace pour les tâches de génération et d'édition de code. Les résultats de l'article associé sont les suivants : DiffuCoder : comprendre et améliorer les modèles de diffusion masquée pour la génération de code .
Ce tutoriel utilise des ressources pour une seule carte RTX 4090.
2. Exemples de projets

3. Étapes de l'opération
1. Après avoir démarré le conteneur, cliquez sur l'adresse API pour accéder à l'interface Web

2. Étapes d'utilisation
Si « Bad Gateway » s'affiche, cela signifie que le modèle est en cours d'initialisation. Étant donné que le modèle est grand, veuillez patienter environ 2 à 3 minutes et actualiser la page.

Description des paramètres
- Paramètres avancés :
- Température : contrôle la diversité de la génération, plus elle est élevée plus elle est aléatoire, plus elle est basse plus elle est déterministe.
- Top-p : seuil cumulatif d'échantillonnage probabiliste. Plus la valeur est faible, plus la génération est prudente.
- Max-tokens : limite la longueur maximale d'une seule génération du modèle.
4. Discussion
🖌️ Si vous voyez un projet de haute qualité, veuillez laisser un message en arrière-plan pour le recommander ! De plus, nous avons également créé un groupe d’échange de tutoriels. Bienvenue aux amis pour scanner le code QR et commenter [Tutoriel SD] pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats de l'application↓

Informations sur la citation
Les informations de citation pour ce projet sont les suivantes :
@article{gong2025diffucoder,
title={DiffuCoder: Understanding and Improving Masked Diffusion Models for Code Generation},
author={Shansan Gong, Ruixiang Zhang, Huangjie Zheng, Jiatao Gu, Navdeep Jaitly, Lingpeng Kong, Yizhe Zhang},
year={2025},
eprint={2506.20639},
archivePrefix={arXiv},
primaryClass={cs.CL},
url={https://arxiv.org/abs/2506.20639},
}Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.