HyperAI초신경

Eurus-2-RL-Data 수학적 프로그래밍 문제 학습 데이터 세트

날짜

4달 전

크기

1.16 GB

발행 주소

huggingface.co

Eurus-2-RL-Data는 강화 학습 훈련을 위해 특별히 제작된 고품질 데이터 세트로, 주로 수학 및 프로그래밍 문제를 해결하는 데 사용됩니다. 관련 블로그는 "암묵적 보상을 통한 프로세스 강화".

이 데이터 세트의 수학 문제는 부분적으로 NuminaMath-CoT에서 파생되었으며, 중국 고등학교 수학에서 국제 수학 올림피아드까지 광범위한 주제를 다룹니다. 프로그래밍 관련 질문은 APPS, CodeContests, TACO, Codeforces 등 다양한 플랫폼에서 나오며, 주로 프로그래밍 경연 대회 수준의 질문을 대상으로 합니다. 데이터 품질을 보장하기 위해 Eurus-2-RL-Data는 엄격하게 정리되고 필터링되었습니다. 수학 문제는 고급 추론 모델(예: Qwen-QwQ)을 사용하여 해결할 수 없는 문제, 일치하지 않는 문제 또는 잘못 답변한 문제를 제거하고, 객관식 문제는 개방형 문제로서 전환했습니다. 프로그래밍 문제는 주로 반복되는 내용을 제거하는 것입니다. 이러한 치료 후,이 데이터 세트에는 총 455,000개의 수학 문제와 27,000개의 프로그래밍 문제가 포함되어 있습니다. Eurus-2-RL-Data의 주요 적용 분야는 강화 학습과 프로그래밍 경연 대회입니다. 이는 모델에 효과적인 학습 플랫폼을 제공하여 복잡한 문제를 해결할 때 더욱 심층적으로 학습하고 최적화하는 데 도움이 됩니다.

Eurus-2-RL-Data.torrent
시딩 0다운로드 중 1완료됨 54총 다운로드 횟수 34
  • Eurus-2-RL-Data/
    • README.md
      1.82 KB
    • README.txt
      3.64 KB
      • data/
        • Eurus-2-RL-Data.zip
          1.16 GB