Command Palette
Search for a command to run...
K2-V2:一个360-开放、推理增强的LLM
K2-V2:一个360-开放、推理增强的LLM
Abstract
我们推出了K2-V2,这是一个从零开始构建的360度开放大型语言模型(LLM),不仅具备通用LLM所拥有的对话、知识检索等功能,更旨在作为推理适配的优越基础模型。该模型是目前性能最强的完全开源模型,在同规模模型中可与开源权重领先者比肩,超越Qwen2.5-72B,并接近Qwen3-235B的性能水平。我们在训练过程中主动融入领域知识、推理能力、长上下文处理以及工具使用能力,从而明确为复杂推理任务做好准备。通过简单的监督微调(supervised fine-tuning),我们已充分展示了其潜力,建立了一个强有力的基线,表明在高级对齐方面仍具备巨大的提升空间。我们公开了完整的训练历史与数据构成,以最大化持续训练的效果——这是开源生态中的关键应用场景。此次我们同步发布模型权重及标志性LLM360资产(如完整的训练数据),旨在为社区提供一个强大且以推理为核心的通用基础平台。