JetBrains 推出 Mellum:40 亿参数的开源 AI 编码模型,助力开发者提效与安全挑战并存
近日,著名的应用开发工具供应商JetBrains公司发布了其首款开源的人工智能编码模型——Mellum。这一举措不仅标志着该公司在AI领域的最新进展,也为开发者们提供了一个强大的新工具。 Mellum是一款专门用于代码补全的AI模型,已于本周三在Hugging Face平台上公开发布。该模型拥有4亿个参数,训练数据量超过4万亿个token(大约相当于1200万行代码),旨在提高代码生成的质量和效率。Mellum可以集成到专业开发者工具中,例如IDE中的智能代码建议功能,也可以用于AI辅助编程、代码理解研究和教育应用。此外,JetBrains还提供了几个针对Python语言细调过的Mellum模型,但这些模型目前仅用于测试潜在能力,而不是生产环境部署。 为训练Mellum,JetBrains使用了包括GitHub上的许可代码和英文维基百科文章在内的多个数据集,整个训练过程大约耗时20天,在256个Nvidia H200 GPU组成的集群上完成。尽管Mellum表现出色,但也存在一定的局限性。JetBrains指出,Mellum可能会反映出公共代码库中存在的偏见,生成的代码不一定安全或无漏洞。因此,公司在使用Mellum时需谨慎对待,特别是在安全性和代码质量方面。 实际上,AI生成代码带来的安全挑战已经成为业界关注的焦点。根据2023年末的一项调查,超过50%的组织在使用AI生成的代码时遇到过安全问题,有时甚至频繁出现。这一调查由开发者安全平台Snyk进行,显示了AI在软件开发中的广泛应用和潜在风险。 即便如此,JetBrains认为Mellum的开源发布仍然具有重要意义。公司表示,希望通过这一平台激发更多的实验、贡献和合作。“这不是终点,只是一个起点。”JetBrains在一篇博客文章中写道,“我们不想追求普适性,而是要建立专注。如果Mellum能够激发一个有意义的实验、贡献或合作,我们就会认为这是一个胜利。” 总之,Mellum的发布不仅为开发者提供了一个新的AI辅助编程工具,也强调了在使用这类工具时需要平衡创新与安全的重要性。 业内人士普遍认为,JetBrains的这次发布展现了其在AI领域的持续投入和技术实力。作为一家以开发高质量开发者工具而闻名的公司,JetBrains一直致力于通过技术创新提升开发者的生产力和效率。此次开源Mellum不仅有助于推动社区的发展,也有望促进更多开发者参与到AI编码技术的研究与应用中。
