Command Palette
Search for a command to run...
K2-V2: 360-오픈, 추론 강화형 LLM
K2-V2: 360-오픈, 추론 강화형 LLM
초록
우리는 일반적인 대규모 언어 모델(LLM)이 제공하는 대화 및 지식 검색 기능 외에도, 추론 적응을 위한 우수한 기반으로서 완전히 새로 구축한 360도 개방형 LLM인 K2-V2를 소개한다. 이 모델은 동급에서 가장 강력한 완전 개방형 모델로, 개방형 가중치를 가진 주요 모델들과 경쟁할 수 있는 수준이며, Qwen2.5-72B를 능가하고 Qwen3-235B의 성능에 근접한다. 훈련 과정 전반에 걸쳐 도메인 지식, 추론 능력, 긴 컨텍스트 처리, 도구 사용 기능을 적극적으로 통합함으로써, 복잡한 추론 작업에 특화된 모델을 구축하였다. 간단한 지도 기반 미세조정(supervised fine-tuning)을 통해 이 잠재력을 입증하였으며, 고도화된 정렬(alignment)을 위한 상당한 성능 개선 여지가 있음을 보여주는 강력한 기준 성능을 확립하였다. 전체 훈련 이력과 데이터 구성 정보를 공개함으로써, 지속적인 훈련이라는 주요 오픈소스 개발 시나리오의 효과를 극대화하였다. 본 연구는 모델 가중치와 함께 LLM360의 핵심 아티팩트(예: 완전한 훈련 데이터 등)도 함께 공개하여, 추론 중심의 강력한 기반을 커뮤니티에 제공함으로써, 공동체의 연구 및 개발 활동을 지원한다.