摘要

我们推出了K2-V2，这是一个从零开始构建的360度开放大型语言模型（LLM），不仅具备通用LLM所拥有的对话、知识检索等功能，更旨在作为推理适配的优越基础模型。该模型是目前性能最强的完全开源模型，在同规模模型中可与开源权重领先者比肩，超越Qwen2.5-72B，并接近Qwen3-235B的性能水平。我们在训练过程中主动融入领域知识、推理能力、长上下文处理以及工具使用能力，从而明确为复杂推理任务做好准备。通过简单的监督微调（supervised fine-tuning），我们已充分展示了其潜力，建立了一个强有力的基线，表明在高级对齐方面仍具备巨大的提升空间。我们公开了完整的训练历史与数据构成，以最大化持续训练的效果——这是开源生态中的关键应用场景。此次我们同步发布模型权重及标志性LLM360资产（如完整的训练数据），旨在为社区提供一个强大且以推理为核心的通用基础平台。

源 PDF