Command Palette

Search for a command to run...

NextCoder 코드 편집 데이터 세트

날짜

4달 전

크기

235.34 MB

기관

마이크로소프트

라이선스

MIT

NextCoder는 Microsoft가 2025년에 출시한 합성 대화 코딩 편집 데이터 세트입니다. 관련 논문 결과는 다음과 같습니다.NextCoder: 다양한 코드 편집에 맞춰 코드 LM을 강력하게 적용주로 대규모 언어 모델의 미세 조정에 사용되어 코드 수정, 리팩토링 및 최적화에서 모델의 성능을 향상시킵니다. AI 프로그래밍 어시스턴트 훈련과 코드 판독 및 다중 라운드 상호작용 기능 향상에 매우 적합합니다.

이 데이터 세트에는 Python, Java, C++, C, Rust, JavaScript, Go, Kotlin 등 8개 언어를 포함하여 약 381,000개의 단일 턴 지시 샘플(NextCoderDataset)과 57,000개의 다중 턴 대화 샘플(대화형 버전)이 포함되어 있습니다. 데이터는 GPT‑4o 및 LLaMA‑3.3‑70B‑Instruct 모델에 의해 생성됩니다.

데이터 분포:

  • 자바스크립트: 16030
  • 파이썬: 15279
  • C:17153
  • C++: 17337
  • 녹: 16438
  • 이동: 15204
  • 코틀린: 13272
  • 자바: 16328
NextCoder.torrent
시딩 1다운로드 중 0완료됨 38총 다운로드 횟수 103
  • NextCoder/
    • README.md
      1.53 KB
    • README.txt
      3.07 KB
      • data/
        • NextCoder.zip
          235.34 MB

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
NextCoder 코드 편집 데이터 세트 | 데이터셋 | HyperAI초신경