HyperAIHyperAI

Command Palette

Search for a command to run...

WebInstruct에서 검증된 다중 도메인 추론 데이터 세트

날짜

10달 전

조직

University of Waterloo

Paper URL

arxiv.org

라이선스

Apache 2.0

WebInstruct-verified는 워털루 대학교와 벡터 연구소가 2025년에 공동으로 발표한 다중 도메인 추론 데이터 세트입니다. 관련 논문 결과는 다음과 같습니다.일반 추론: 모든 도메인에서 LLM 추론 발전"는 수학 분야의 강점을 유지하면서 다양한 분야에서 LLM의 추론 능력을 향상시키는 것을 목표로 합니다. 이 데이터셋은 약 23만 개의 추론 문제를 포함하고 있으며, 객관식 문제와 수치 표현 데이터셋의 균형 잡힌 분포를 포함한 다양한 답변 형식을 포함합니다. 이 데이터셋은 주로 수학, 물리학, 화학, 금융, 그리고 기타 다양한 인문학 및 사회과학 분야를 다룹니다.

데이터 세트 특성:

  • 제로 RL 훈련: 중간 감독 단계를 건너뛰고 기본 LLM에서 직접 강화 학습을 수행합니다.
  • 다양한 추론 데이터: 웹에서 수집한 23만 개 이상의 고품질 검증 가능한 질문이 여러 학문 분야에서 답변 검증을 위해 필터링되었습니다.
  • 모델 기반 검증기: 컨텍스트 인식, 사고 사슬 답변 검증을 위한 1.5B 크기의 컴팩트한 생성 검증기 모델로, 기존의 규칙 기반 접근 방식보다 성능이 뛰어납니다.
    데이터 세트 필드 분포
    데이터 세트 필드 분포

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
WebInstruct에서 검증된 다중 도메인 추론 데이터 세트 | 데이터 세트 | HyperAI초신경