HyperAI

近日，著名的应用开发工具供应商JetBrains公司发布了其首款开源的人工智能编码模型——Mellum。这一举措不仅标志着该公司在AI领域的最新进展，也为开发者们提供了一个强大的新工具。 Mellum是一款专门用于代码补全的AI模型，已于本周三在Hugging Face平台上公开发布。该模型拥有4亿个参数，训练数据量超过4万亿个token（大约相当于1200万行代码），旨在提高代码生成的质量和效率。Mellum可以集成到专业开发者工具中，例如IDE中的智能代码建议功能，也可以用于AI辅助编程、代码理解研究和教育应用。此外，JetBrains还提供了几个针对Python语言细调过的Mellum模型，但这些模型目前仅用于测试潜在能力，而不是生产环境部署。为训练Mellum，JetBrains使用了包括GitHub上的许可代码和英文维基百科文章在内的多个数据集，整个训练过程大约耗时20天，在256个Nvidia H200 GPU组成的集群上完成。尽管Mellum表现出色，但也存在一定的局限性。JetBrains指出，Mellum可能会反映出公共代码库中存在的偏见，生成的代码不一定安全或无漏洞。因此，公司在使用Mellum时需谨慎对待，特别是在安全性和代码质量方面。实际上，AI生成代码带来的安全挑战已经成为业界关注的焦点。根据2023年末的一项调查，超过50%的组织在使用AI生成的代码时遇到过安全问题，有时甚至频繁出现。这一调查由开发者安全平台Snyk进行，显示了AI在软件开发中的广泛应用和潜在风险。即便如此，JetBrains认为Mellum的开源发布仍然具有重要意义。公司表示，希望通过这一平台激发更多的实验、贡献和合作。“这不是终点，只是一个起点。”JetBrains在一篇博客文章中写道，“我们不想追求普适性，而是要建立专注。如果Mellum能够激发一个有意义的实验、贡献或合作，我们就会认为这是一个胜利。” 总之，Mellum的发布不仅为开发者提供了一个新的AI辅助编程工具，也强调了在使用这类工具时需要平衡创新与安全的重要性。业内人士普遍认为，JetBrains的这次发布展现了其在AI领域的持续投入和技术实力。作为一家以开发高质量开发者工具而闻名的公司，JetBrains一直致力于通过技术创新提升开发者的生产力和效率。此次开源Mellum不仅有助于推动社区的发展，也有望促进更多开发者参与到AI编码技术的研究与应用中。

相关链接

相关链接

相关链接

视觉真实之外：清华 WorldArena 全新评测体系揭示具身世界模型的能力鸿沟

视觉真实之外：清华 WorldArena 全新评测体系揭示具身世界模型的能力鸿沟

Command Palette

JetBrains 推出 Mellum：40 亿参数的开源 AI 编码模型，助力开发者提效与安全挑战并存

相关链接

Command Palette

JetBrains 推出 Mellum：40 亿参数的开源 AI 编码模型，助力开发者提效与安全挑战并存

相关链接

Command Palette

JetBrains 推出 Mellum：40 亿参数的开源 AI 编码模型，助力开发者提效与安全挑战并存

相关链接

视觉真实之外：清华 WorldArena 全新评测体系揭示具身世界模型的能力鸿沟

视觉真实之外：清华 WorldArena 全新评测体系揭示具身世界模型的能力鸿沟