DiffuCode-7B-cpGRPO: マスク拡散技術に基づくコード生成モデル

1. チュートリアルの概要

DiffuCoder-7B-cpGRPOは、2025年6月25日にAppleチームが関連論文で初めて提案した、マスク付き拡散ベースコード生成モデル(dLLM)です。厳選された2万件以上のコーディング例を用いて学習されています。このモデルは、従来の左から右への自己回帰生成ではなく、反復的なノイズ除去によってコードを生成・編集することを目的としています。DiffuCoder-7B-cpGRPOの注目すべき特徴は、コード生成に左から右への生成に厳密に依存していないことです。そのため、主流のプログラミングベンチマークにおいて、他の拡散ベースプログラミングモデルよりも4.4%高いスコアを獲得しています。この非シーケンシャルなコード生成機能により、コード編集および生成タスクにおいて高い柔軟性と効率性を発揮します。関連論文の結果は以下です。DiffuCoder: コード生成のためのマスク拡散モデルの理解と改善”。
このチュートリアルでは、単一の RTX 4090 カードのリソースを使用します。
2. プロジェクト例

3. 操作手順
1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

2. 使用手順
「Bad Gateway」と表示される場合、モデルが初期化中であることを意味します。モデルが大きいため、2〜3分ほど待ってページを更新してください。

パラメータの説明
- 詳細設定:
- 温度: 世代の多様性を制御します。値が高いほどランダムになり、値が低いほど決定論的になります。
- Top-p: 確率サンプリングの累積閾値。値が小さいほど、生成はより保守的になります。
- 最大トークン: モデルの単一世代の最大長を制限します。
4. 議論
🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。

引用情報
このプロジェクトの引用情報は次のとおりです。
@article{gong2025diffucoder,
title={DiffuCoder: Understanding and Improving Masked Diffusion Models for Code Generation},
author={Shansan Gong, Ruixiang Zhang, Huangjie Zheng, Jiatao Gu, Navdeep Jaitly, Lingpeng Kong, Yizhe Zhang},
year={2025},
eprint={2506.20639},
archivePrefix={arXiv},
primaryClass={cs.CL},
url={https://arxiv.org/abs/2506.20639},
}