Command Palette

Search for a command to run...

Nemotron-사전 훈련-데이터셋-샘플 샘플링 데이터셋

날짜

3달 전

크기

79.87 MB

기관

엔비디아

논문 URL

2508.14444

라이선스

기타

* 이 데이터 세트는 온라인 사용을 지원합니다.여기를 클릭하여 이동하세요.

Nemotron-Pretraining-Dataset-sample은 NVIDIA가 2025년에 발표한 Nemotron 사전 학습 데이터셋의 간소화된 샘플링 버전입니다. 관련 논문 결과는 다음과 같습니다.NVIDIA Nemotron Nano 2: 정확하고 효율적인 하이브리드 Mamba-Transformer 추론 모델".

이 데이터 세트는 전체 SFT와 사전 학습 코퍼스의 다양한 구성 요소에서 선택한 10개의 대표적인 하위 세트로 구성되어 있으며, 고품질의 질의 응답 데이터, 수학 분야에 초점을 맞춘 추출된 콘텐츠, 코드 메타데이터, SFT 스타일 지침 데이터를 포함하고 있어 검토 및 빠른 실험에 적합합니다.

Nemotron-Pretraining-Dataset-sample.torrent
시딩 1다운로드 중 0완료됨 17총 다운로드 횟수 91
  • Nemotron-Pretraining-Dataset-sample/
    • README.md
      1.37 KB
    • README.txt
      2.73 KB
      • data/
        • Nemotron-Pretraining-Dataset-sample.zip
          79.87 MB

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
Nemotron-사전 훈련-데이터셋-샘플 샘플링 데이터셋 | 데이터셋 | HyperAI초신경