Command Palette
Search for a command to run...
DiffuCode-7B-cpGRPO: 마스크 확산 기술을 기반으로 한 코드 생성 모델
GPU 컴퓨팅 에어드롭

1. 튜토리얼 소개

Apple 팀이 2025년 6월 25일 발표한 논문에서 처음 제안한 DiffuCoder-7B-cpGRPO는 마스크 확산 기반 코드 생성 모델(dLLM)입니다. 이 모델은 엄선된 2만 개 이상의 코딩 예제를 사용하여 학습되었습니다. DiffuCoder-7B-cpGRPO는 기존의 좌측에서 우측으로 진행되는 자기회귀 생성 방식이 아닌, 반복적인 노이즈 감소를 통해 코드를 생성하고 편집하는 것을 목표로 합니다. DiffuCoder-7B-cpGRPO의 중요한 특징은 좌측에서 우측으로 진행되는 생성 방식에 엄격하게 의존하지 않는다는 점이며, 이로 인해 다른 확산 기반 프로그래밍 모델에 비해 주요 프로그래밍 벤치마크에서 TP3T 점수가 4.41점 향상되었습니다. 이러한 비순차적 코드 생성 기능 덕분에 코드 편집 및 생성 작업에서 더욱 유연하고 효율적인 성능을 발휘합니다. 관련 논문 결과는 다음과 같습니다. DiffuCoder: 코드 생성을 위한 마스크 확산 모델 이해 및 개선 .
이 튜토리얼에서는 단일 RTX 4090 카드에 대한 리소스를 사용합니다.
2. 프로젝트 예시

3. 작업 단계
1. 컨테이너 시작 후 API 주소를 클릭하여 웹 인터페이스로 진입합니다.

2. 사용 단계
"잘못된 게이트웨이"가 표시되면 모델이 초기화 중임을 의미합니다. 모델이 크기 때문에 약 2~3분 정도 기다리신 후 페이지를 새로고침해 주시기 바랍니다.

매개변수 설명
- 고급 설정:
- 온도: 세대의 다양성을 제어합니다. 높을수록 무작위성이 높아지고 낮을수록 결정성이 높아집니다.
- Top-p: 확률 표본 추출의 누적 임계값. 값이 작을수록 생성이 더 보수적입니다.
- 최대 토큰: 모델의 단일 세대의 최대 길이를 제한합니다.
4. 토론
🖌️ 고품질 프로젝트를 발견하시면, 백그라운드에 메시지를 남겨 추천해주세요! 또한, 튜토리얼 교환 그룹도 만들었습니다. 친구들의 QR코드 스캔과 [SD 튜토리얼] 댓글을 통해 그룹에 가입하여 다양한 기술 이슈에 대해 논의하고 신청 결과를 공유해 주시기 바랍니다.↓

인용 정보
이 프로젝트에 대한 인용 정보는 다음과 같습니다.
@article{gong2025diffucoder,
title={DiffuCoder: Understanding and Improving Masked Diffusion Models for Code Generation},
author={Shansan Gong, Ruixiang Zhang, Huangjie Zheng, Jiatao Gu, Navdeep Jaitly, Lingpeng Kong, Yizhe Zhang},
year={2025},
eprint={2506.20639},
archivePrefix={arXiv},
primaryClass={cs.CL},
url={https://arxiv.org/abs/2506.20639},
}