HyperAI超神经

Osmosis AI 开源了一款名为 Osmosis-Apply-1.7B 的新型代码合并模型，这是 Qwen3-1.7B 的优化版本，专门为高度精确和结构化的代码合并任务设计。与一般的大规模通用语言模型不同，Osmosis-Apply-1.7B 通过采用特定于代码的格式标签、高质量数据集以及 Model Context Protocol（MCP）的集成，实现了在较少参数的情况下依然能够出色完成代码合并任务的目标。目的明确：针对代码合并任务 Osmosis-Apply-1.7B 经过专门训练，能够在函数或代码块级别上应用结构化编辑。该模型接收三个结构化输入：原始代码、编辑或差异集合，以及预期的合并格式。它返回一个修订后的代码块，其中变化被包裹在 <edit> 标签内，并嵌套在 <code> 标签中。这种格式不仅符合生产级标准，还简化了代码验证过程。训练与奖励机制 Osmosis-Apply-1.7B 是在大约 100,000 条来自 commitpackft 数据集的现实世界提交记录上微调而来的，这些记录仅占完整语料库的不到 15%。每个训练样本都经过结构化处理，模拟实际开发工作流。此外，模型还采用了一种基于奖励的后训练系统，这种系统强化了高保真输出，同时允许一定程度上的风格差异，类似于现实中的代码审查流程。基准测试结果 Osmosis AI 使用 commitpackft 数据集中 10,000 条样本对模型进行了基准测试。结果显示，Osmosis-Apply-1.7B 在奖励评分上达到了 0.9805，显著优于 Claude 4 Sonnet（0.9328）、GPT-3.5-turbo（0.8639）和 Gemini-2.5-Flash（0.7745）。这意味着该模型在应用局部变化时能够更好地保留代码的语义、格式和结构。开发者工具和应用场景模型支持本地推理和与 vLLM 或 Gulp Server 等服务的集成，并提供了 CLI 工具和 MCP 服务器实现的参考代码。使用场景包括但不限于在版本控制系统中应用代码差异、自动化代码审查、代码生成任务等。这些功能使得 Osmosis-Apply-1.7B 成为开发者日常工作中非常实用的工具。格式和部署方式 Osmosis-Apply-1.7B 通过 <code> 和 <edit> 标签输出编辑结果，确保与自动验证器的兼容性。为便于部署，模型提供了多种推理就绪的版本，如 safetensors 和 GGUF 格式，可以在本地托管或以量化模式运行，以优化受限硬件上的推理性能。可用性和许可 Osmosis-Apply-1.7B 采用了 Apache-2.0 许可证，并在 Hugging Face 和 GitHub 上托管。发布内容包括所有必要的推理脚本、MCP 兼容部署示例以及格式化指南。这一开源举措进一步推动了代码合并领域的技术创新和发展。行业评价业内专家对 Osmosis-Apply-1.7B 的发布给予了积极评价，认为其在紧凑的模型大小下实现了功能级别的精密编辑，具备很高的实用性和推广价值。Osmosis AI 作为一家专注于机器学习和自然语言处理的创新公司，此次开源不仅体现了其技术实力，也显示了对社区贡献的承诺。

Osmosis AI 推出轻量级代码合并模型 Osmosis-Apply-1.7B，性能超越大型语言模型

Related Links