谷歌更新Gemini 2.5 Pro AI模型,编码能力更强,邀公众体验
谷歌近日宣布对其Gemini 2.5 Pro预览模型进行了一次更新,称这一版本在编程任务上表现更加出色。此次更新是在大约一个月前发布Gemini 2.5 Pro的基础上进行的,谷歌表示,这款模型将在“几周内”面向公众正式推出,并已从今天开始在谷歌的AI开发平台AI Studio和Vertex AI以及Gemini应用中可用。 根据谷歌发布的一篇博客文章,新版本的Gemini 2.5 Pro继续展现出优秀的编程能力,在诸如Aider Polyglot等困难编程基准测试中表现领先。此外,它还在GPQA和Humanity’s Last Exam(HLE)等基准测试中取得了顶尖成绩,这些测试专注于评估模型的数学、科学、知识和推理能力。“它继续领跑在各种艰难的编程基准测试中,”谷歌表示,“同时,它还在数学、科学、知识和推理能力方面表现出一流的能力。” 除了性能提升外,谷歌还根据之前的2.5 Pro版本的用户反馈,改善了模型的风格和结构。现在,2.5 Pro能够以更加创意和格式良好的方式生成回答。“我们听取了用户对于上一个版本的反馈,改进了其风格和结构,使其能在生成更具创意性和格式更佳的回答时,表现得更好。”据称,这次更新包括提高Elo分数,在LMArena上的分数提升了24分至1470,在WebDevArena上的分数则提升了35分至1443,两个平台上均处于领先地位。 对于希望使用升级版模型的开发者而言,谷歌提供了更多的控制选项。例如,在AI Studio和Vertex AI平台上,引入了“思考预算”的概念,让开发者可以更好地管理成本和延迟,优化使用体验。这不仅使得模型更加灵活,也意味着开发者可以根据具体需求调整其性能和成本效益。目前,开发者已经可以利用这一更新版本构建新的应用程序和服务。 谷歌于今年五月首次推出了Gemini 2.5 Pro,并在I/O开发者大会上进行了展示。随着这一最新更新,谷歌希望这款模型能够成为企业级应用的稳定选择,特别是在人工智能编码、网页开发和其他需要高度专业知识的任务中。未来的几周内,该模型将全面对外开放,预计将对多个领域的开发者产生重要影响,帮助他们更高效地完成工作,推动技术创新和发展。 背景补充: Gemini 2.5 Pro 是谷歌最新的大规模语言模型之一,旨在为企业提供更强大的自然语言处理能力。在人工智能领域,谷歌一直是前沿技术的研究者和推动者,这款模型的不断迭代和完善显示了其在自然语言处理和机器学习方面的持续进步。此外,随着越来越多的企业开始采用AI技术来优化业务流程,谷歌的这一更新有望加速行业发展,帮助企业更好地应对日益复杂的挑战。