Command Palette
Search for a command to run...
MCD 멀티모달 코드 생성 데이터 세트
멀티모달 코딩 데이터셋(MCD)은 Microsoft Research, Peking University, Southern University of Science and Technology가 제안하여 2025년에 공개한 대규모 데이터셋입니다. 관련 논문 결과는 다음과 같습니다.VisCodex: 비전 및 코딩 모델 병합을 통한 통합 멀티모달 코드 생성".
이 데이터 세트에는 총 약 598,000개의 고품질 샘플/쌍이 포함되어 있으며, 여러 입력 모드(텍스트, 이미지, 코드)와 출력 모드(코드, 답변, 설명)를 포괄하는 지침 따르기 형식으로 구성되어 있으며 다중 모드 코드 이해 및 생성 작업에 적합합니다.
데이터에는 다음이 포함됩니다.
- 향상된 HTML 코드(HTML): 시각적 효과와 구조적 최적화에 초점을 맞춘 약 20만 개의 코드-스크린샷 쌍입니다.
- 차트: 이미지-코드 재생성을 위한 약 210,000개의 이미지-코드 쌍.
- 질문과 답변(QA): 약 59,000개의 코드-질문-답변 쌍으로, 코드를 중심으로 한 질문과 답변이 포함되어 있습니다.
- 알고리즘: 약 129,000개의 알고리즘 코딩 문제와 명령어 따르기 샘플.
MCD.torrent
시딩 1다운로드 중 0완료됨 8총 다운로드 횟수 39