Discord에서 논의하기

5달 전

감독된 미세조정

Zhengzhong Liu Liping Tang Linghao Jin Haonan Li Nikhil Ranjan Desai Fan Shaurya Rohatgi Richard Fan Omkar Pangarkar Huijuan Wang

초록

우리는 일반적인 대규모 언어 모델(LLM)이 제공하는 대화 및 지식 검색 기능 외에도, 추론 적응을 위한 우수한 기반으로서 완전히 새로 구축한 360도 개방형 LLM인 K2-V2를 소개한다. 이 모델은 동급에서 가장 강력한 완전 개방형 모델로, 개방형 가중치를 가진 주요 모델들과 경쟁할 수 있는 수준이며, Qwen2.5-72B를 능가하고 Qwen3-235B의 성능에 근접한다. 훈련 과정 전반에 걸쳐 도메인 지식, 추론 능력, 긴 컨텍스트 처리, 도구 사용 기능을 적극적으로 통합함으로써, 복잡한 추론 작업에 특화된 모델을 구축하였다. 간단한 지도 기반 미세조정(supervised fine-tuning)을 통해 이 잠재력을 입증하였으며, 고도화된 정렬(alignment)을 위한 상당한 성능 개선 여지가 있음을 보여주는 강력한 기준 성능을 확립하였다. 전체 훈련 이력과 데이터 구성 정보를 공개함으로써, 지속적인 훈련이라는 주요 오픈소스 개발 시나리오의 효과를 극대화하였다. 본 연구는 모델 가중치와 함께 LLM360의 핵심 아티팩트(예: 완전한 훈련 데이터 등)도 함께 공개하여, 추론 중심의 강력한 기반을 커뮤니티에 제공함으로써, 공동체의 연구 및 개발 활동을 지원한다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩

바로 사용 가능한 GPU

최적의 가격

시작하기 가격 보기

HyperAI Newsletters

최신 정보 구독하기

한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다

이메일 서비스 제공: MailChimp

Discord에서 논의하기

5달 전

감독된 미세조정

Zhengzhong Liu Liping Tang Linghao Jin Haonan Li Nikhil Ranjan Desai Fan Shaurya Rohatgi Richard Fan Omkar Pangarkar Huijuan Wang

초록

우리는 일반적인 대규모 언어 모델(LLM)이 제공하는 대화 및 지식 검색 기능 외에도, 추론 적응을 위한 우수한 기반으로서 완전히 새로 구축한 360도 개방형 LLM인 K2-V2를 소개한다. 이 모델은 동급에서 가장 강력한 완전 개방형 모델로, 개방형 가중치를 가진 주요 모델들과 경쟁할 수 있는 수준이며, Qwen2.5-72B를 능가하고 Qwen3-235B의 성능에 근접한다. 훈련 과정 전반에 걸쳐 도메인 지식, 추론 능력, 긴 컨텍스트 처리, 도구 사용 기능을 적극적으로 통합함으로써, 복잡한 추론 작업에 특화된 모델을 구축하였다. 간단한 지도 기반 미세조정(supervised fine-tuning)을 통해 이 잠재력을 입증하였으며, 고도화된 정렬(alignment)을 위한 상당한 성능 개선 여지가 있음을 보여주는 강력한 기준 성능을 확립하였다. 전체 훈련 이력과 데이터 구성 정보를 공개함으로써, 지속적인 훈련이라는 주요 오픈소스 개발 시나리오의 효과를 극대화하였다. 본 연구는 모델 가중치와 함께 LLM360의 핵심 아티팩트(예: 완전한 훈련 데이터 등)도 함께 공개하여, 추론 중심의 강력한 기반을 커뮤니티에 제공함으로써, 공동체의 연구 및 개발 활동을 지원한다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩

바로 사용 가능한 GPU

최적의 가격

시작하기 가격 보기

HyperAI Newsletters

최신 정보 구독하기

한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다

이메일 서비스 제공: MailChimp

K2-V2: 360-오픈, 추론 강화형 LLM | 문서 | HyperAI초신경