라마-네모트론 추론 데이터 세트
이 데이터 세트는 NVIDIA가 2025년에 발표한 고품질 다중 도메인 추론 데이터 세트입니다. 관련 논문 결과는 다음과 같습니다.라마-네모트론: 효율적 추론 모델"는 수학, 코드, 과학적 추론 및 지시 따르기 등의 작업에서 대규모 언어 모델의 성능 향상을 지원하고 Llama-3.1/3.3-Nemotron 시리즈 모델이 더욱 효율적인 추론 기능을 달성하도록 돕는 것을 목표로 합니다.
이 데이터 세트에는 약 2,206만 개의 수학 데이터, 약 1,010만 개의 코드 데이터가 포함되어 있으며, 나머지는 과학 및 교육 추종 분야의 데이터입니다. 이 데이터는 Llama-3.3-70B-Instruct, DeepSeek-R1, Qwen-2.5 등 여러 모델을 통해 협업적으로 생성되었으며, 다양한 추론 스타일과 문제 해결 경로를 포괄하여 대규모 모델 학습의 다양한 요구 사항을 충족합니다.
Llama-Nemotron.torrent
시딩 2다운로드 중 0완료됨 7총 다운로드 횟수 11