HyperAI超神经

一、教程简介

Kimi-Dev-72B 是由中国人工智能公司月之暗面团队于 2025 年 6 月 17 日发布的一款专为软件工程任务设计的开源大语言模型。在 SWE-bench Verified 编程基准测试中达到 60.4% 的性能，凭借其仅 72 亿的参数量，一举夺魁，超越了近期发布、参数量高达 671 亿的新版 DeepSeek-R1，成为当前开源模型中的 SOTA 。

主要功能：

代码修复（BugFixer）：自动定位代码中的错误生成修复补丁，解决软件开发中的漏洞和缺陷。
测试代码生成（TestWriter）：为现有代码编写单元测试，确保代码质量和功能正确性。
自动化开发流程：基于强化学习和自我博弈机制，协调修复和测试能力，提升开发效率。
与开发工具集成：未来将与 IDE 、版本控制系统和 CI/CD 流水线深度集成，无缝融入开发工作流。

技术原理：

角色分工（BugFixer 和 TestWriter）：模型扮演两种角色，分别负责修复代码和编写测试，两者共享文件定位和代码编辑的框架。
中期训练（Mid-training）：用约 1,500 亿高质量数据进行训练，增强模型对实际开发任务的理解。
强化学习（Reinforcement Learning）：在 Docker 环境中运行代码根据测试结果给予奖励，提升模型的代码编辑能力。
测试时自我博弈（Test-time Self-Play）：在测试阶段，模型生成多个补丁和测试候选，基于自我博弈机制协调修复和测试能力，提升整体性能。

应用场景：

代码修复：快速检测修复代码中的错误或漏洞，减少人工排查和修复的时间。
测试代码生成：为现有代码生成高质量的单元测试代码，提升测试覆盖率。
开发流程自动化：与主流 IDE 集成，提供实时代码修复建议和测试代码生成功能。
编程教育：帮助初学者快速理解和掌握编程技能，基于生成示例代码和测试代码辅助学习。
开源项目维护：帮助开源项目的维护者快速修复漏洞和优化代码，提升项目质量和稳定性。

该教程算力资源采用单卡 RTX A6000，本教程部署的模型为 Kimi-Dev-72B-GGUF/Kimi-Dev-72B-IQ4_NL.gguf 。

二、效果展示

三、运行步骤

1. 启动容器

2. 进入网页后，即可与模型展开对话

若不显示「Model」，这表示模型正在初始化，由于模型较大，请等待约 2-3 分钟后刷新页面。

四、交流探讨

🖌️ 如果大家看到优质项目，欢迎后台留言推荐！另外，我们还建立了教程交流群，欢迎小伙伴们扫码备注【SD 教程】入群探讨各类技术问题、分享应用效果↓

引用信息

本项目引用信息如下：

@misc{kimi_dev_72b_2025,
  title        = {Introducing Kimi-Dev-72B: A Strong and Open Coding LLM for Issue Resolution},
  author       = {{Kimi-Dev Team}},
  year         = {2025},
  month        = {June},
  url          = {\url{https://www.moonshot.cn/Kimi-Dev}}
}