HyperAIHyperAI

Command Palette

Search for a command to run...

TxT360-3efforts 멀티태스크 추론 데이터셋

Discord에서 논의하기

날짜

4달 전

조직

Mohamed bin Zayed University of Artificial Intelligence

Paper URL

2512.06201

라이선스

CC BY 4.0

TxT360-3efforts는 2025년 모하메드 빈 자예드 인공지능 대학교에서 공개한 지도 미세 조정(SFT)을 위한 대규모 언어 모델 학습 데이터셋입니다. 관련 논문은 다음과 같습니다... K2-V2: 360도 개방형, 추론 능력 강화형 LLM목표는 채팅 템플릿을 통해 모델의 세 가지 추론 강도를 제어하는 것입니다. 이 데이터셋은 약 1천만 개의 샘플과 100억 개의 학습 토큰으로 구성되어 있으며, 수학, 코딩, 일반 대화, STEM 추론, 지시 따르기, 도구 호출, 에이전트 궤적, 자기 정체성 모델링, 보안 정렬 등 9가지 작업 범주를 포괄합니다. 다수의 다중 턴 대화와 검증 가능한 제약 조건을 가진 샘플을 포함하고 있습니다. 데이터는 오픈 소스 라이선스가 부여된 공개 데이터셋 또는 고품질 합성 데이터에서 가져왔으며, 엄격한 품질 필터링, 중복 제거 및 벤치마크 검증 과정을 거쳤습니다. 답변은 주로 GPT-OSS-120B 모델이 다양한 추론 강도로 생성했습니다. 데이터셋은 통합된 채팅 템플릿을 사용하여 낮음, 중간, 높음의 추론 강도를 명확하게 구분함으로써, 모델이 학습 과정에서 다양한 추론 요구 사항에 따라 생성 길이와 추론 깊이를 조정할 수 있도록 합니다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
TxT360-3efforts 멀티태스크 추론 데이터셋 | 데이터 세트 | HyperAI초신경