HyperAIHyperAI

Command Palette

Search for a command to run...

K2-V2: 360-오픈, 추론 강화형 LLM

초록

우리는 일반적인 대규모 언어 모델(LLM)이 제공하는 대화 및 지식 검색 기능 외에도, 추론 적응을 위한 우수한 기반으로서 완전히 새로 구축한 360도 개방형 LLM인 K2-V2를 소개한다. 이 모델은 동급에서 가장 강력한 완전 개방형 모델로, 개방형 가중치를 가진 주요 모델들과 경쟁할 수 있는 수준이며, Qwen2.5-72B를 능가하고 Qwen3-235B의 성능에 근접한다. 훈련 과정 전반에 걸쳐 도메인 지식, 추론 능력, 긴 컨텍스트 처리, 도구 사용 기능을 적극적으로 통합함으로써, 복잡한 추론 작업에 특화된 모델을 구축하였다. 간단한 지도 기반 미세조정(supervised fine-tuning)을 통해 이 잠재력을 입증하였으며, 고도화된 정렬(alignment)을 위한 상당한 성능 개선 여지가 있음을 보여주는 강력한 기준 성능을 확립하였다. 전체 훈련 이력과 데이터 구성 정보를 공개함으로써, 지속적인 훈련이라는 주요 오픈소스 개발 시나리오의 효과를 극대화하였다. 본 연구는 모델 가중치와 함께 LLM360의 핵심 아티팩트(예: 완전한 훈련 데이터 등)도 함께 공개하여, 추론 중심의 강력한 기반을 커뮤니티에 제공함으로써, 공동체의 연구 및 개발 활동을 지원한다.


AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
K2-V2: 360-오픈, 추론 강화형 LLM | 문서 | HyperAI초신경