HyperAIHyperAI

Command Palette

Search for a command to run...

DiffuCode-7B-cpGRPO: マスク拡散技術に基づくコード生成モデル

Date

6ヶ月前

Size

12.8 MB

License

Other

Paper URL

2506.20639

1. チュートリアルの概要

GitHubスター

DiffuCoder-7B-cpGRPOは、Appleのチームが2025年6月25日に発表した論文で初めて提案した、マスク付き拡散ベースコード生成モデル(dLLM)です。厳選された2万件以上のコーディング例を用いて学習されました。このモデルは、従来の左から右への自己回帰的な生成ではなく、反復的なノイズ低減を通じてコードを生成・編集することを目的としています。DiffuCoder-7B-cpGRPOの重要な特徴は、左から右への生成に厳密に依存していないことです。これにより、他の拡散ベースプログラミングモデルと比較して、主流のプログラミングベンチマークにおけるTP3Tスコアが4.41向上しました。この非シーケンシャルなコード生成機能により、コード編集および生成タスクにおいて、より柔軟かつ効率的に作業を行うことができます。関連論文の結果は次のとおりです。 DiffuCoder: コード生成のためのマスク拡散モデルの理解と改善

このチュートリアルでは、単一の RTX 4090 カードのリソースを使用します。

2. プロジェクト例

3. 操作手順

1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

2. 使用手順

「Bad Gateway」と表示される場合、モデルが初期化中であることを意味します。モデルが大きいため、2〜3分ほど待ってページを更新してください。

パラメータの説明

  • 詳細設定:
    • 温度: 世代の多様性を制御します。値が高いほどランダムになり、値が低いほど決定論的になります。
    • Top-p: 確率サンプリングの累積閾値。値が小さいほど、生成はより保守的になります。
    • 最大トークン: モデルの単一世代の最大長を制限します。

4. 議論

🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。

引用情報

このプロジェクトの引用情報は次のとおりです。

@article{gong2025diffucoder,
  title={DiffuCoder: Understanding and Improving Masked Diffusion Models for Code Generation},
  author={Shansan Gong, Ruixiang Zhang, Huangjie Zheng, Jiatao Gu, Navdeep Jaitly, Lingpeng Kong, Yizhe Zhang},
  year={2025},
  eprint={2506.20639},
  archivePrefix={arXiv},
  primaryClass={cs.CL},
  url={https://arxiv.org/abs/2506.20639},
}

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています