HyperAI초신경

SynLogic 추론 데이터 세트

날짜

6일 전

기관

발행 주소

huggingface.co

카테고리

다운로드 도움말

SynLogic은 홍콩과학기술대학교와 MiniMax 연구팀이 2025년에 발표한 포괄적인 합성 논리 추론 데이터셋입니다. 관련 논문 결과는 다음과 같습니다.SynLogic: 논리적 추론 및 그 이상을 학습하기 위한 대규모 검증 가능한 추론 데이터 합성"는 검증 가능한 보상을 통한 강화 학습을 통해 대규모 언어 모델(LLM)의 논리적 추론 능력을 향상시키는 것을 목표로 합니다.

이 데이터 세트에는 35개의 다양한 논리적 추론 과제가 포함되어 있으며 자동 검증 기능이 있어 강화 학습 훈련에 적합합니다.

주요 특징

  • 35가지 유형의 과제: 수도쿠, 24점 게임, 비밀번호, 화살표 미로, 산술 퍼즐 등
  • 검증 가능한 보너스: 모든 샘플에는 정확성 확인을 위한 자동 검증기가 있습니다.
  • 조절 가능한 난이도: 각 작업에는 조절 가능한 난이도 매개변수가 있습니다.
  • 두 가지 버전: 쉬운 버전(7B 모델용)과 어려운 버전(32B 모델용)

데이터 세트 구성

신로직-이지

  • 목표: 7B 매개변수 모델
  • : 27개 미션
  • 견본: 약 16,000개의 훈련 인스턴스

신로직-하드

  • 목표:32B 매개변수 모델
  • : 전체 35개 과제
  • 견본: 약 33,000개의 훈련 인스턴스