Command Palette
Search for a command to run...
TxT360-3efforts 멀티태스크 추론 데이터셋
TxT360-3efforts는 2025년 모하메드 빈 자예드 인공지능 대학교에서 공개한 지도 미세 조정(SFT)을 위한 대규모 언어 모델 학습 데이터셋입니다. 관련 논문은 다음과 같습니다... K2-V2: 360도 개방형, 추론 능력 강화형 LLM목표는 채팅 템플릿을 통해 모델의 세 가지 추론 강도를 제어하는 것입니다. 이 데이터셋은 약 1천만 개의 샘플과 100억 개의 학습 토큰으로 구성되어 있으며, 수학, 코딩, 일반 대화, STEM 추론, 지시 따르기, 도구 호출, 에이전트 궤적, 자기 정체성 모델링, 보안 정렬 등 9가지 작업 범주를 포괄합니다. 다수의 다중 턴 대화와 검증 가능한 제약 조건을 가진 샘플을 포함하고 있습니다. 데이터는 오픈 소스 라이선스가 부여된 공개 데이터셋 또는 고품질 합성 데이터에서 가져왔으며, 엄격한 품질 필터링, 중복 제거 및 벤치마크 검증 과정을 거쳤습니다. 답변은 주로 GPT-OSS-120B 모델이 다양한 추론 강도로 생성했습니다. 데이터셋은 통합된 채팅 템플릿을 사용하여 낮음, 중간, 높음의 추론 강도를 명확하게 구분함으로써, 모델이 학습 과정에서 다양한 추론 요구 사항에 따라 생성 길이와 추론 깊이를 조정할 수 있도록 합니다.