HyperAI초신경

GeneralThought-430K 대규모 추론 데이터 세트

날짜

2달 전

크기

1.49 GB

발행 주소

huggingface.co

카테고리

GeneralThought-430K는 General Reasoning 팀이 2025년에 공개한 대규모 추론 데이터 세트입니다. 이 데이터 세트는 대규모 언어 모델의 논리적 추론, 학제 간 지식 통합, 복잡한 문제 해결 능력을 훈련하고 평가하기 위한 표준화된 리소스를 제공하는 것을 목표로 합니다.

이 데이터셋은 수학, 코드, 물리, 화학, 자연과학, 인문학 및 사회과학, 공학 기술 등 다양한 분야의 문제를 포괄하는 43만 개의 샘플을 포함하고 있습니다. DeepSeek-R1, DeepSeek-R1-Zero, OpenThoughts-32B, LIMO 및 기타 주류 모델을 포함한 여러 추론 모델의 질문, 참조 답변, 추론 경로, 최종 답변 및 기타 메타데이터가 포함되어 있습니다. o3-mini-2025-01-31, gemini-2-flash-thinking-exp-01-21, claude-3-7-sonnet-20250219의 최종 답변도 비교 및 평가를 위해 포함되었습니다.

일반 생각-430K.torrent
시딩 1다운로드 중 0완료됨 11총 다운로드 횟수 26
  • GeneralThought-430K/
    • README.md
      1.49 KB
    • README.txt
      2.98 KB
      • data/
        • GeneralThought-430K.zip
          1.49 GB