HyperAI超神经
Back to Headlines

谷歌更新 Gemini 2.5 Pro AI 模型,编码能力更强,邀您抢先体验。

2 days ago

谷歌于周四宣布对其Gemini 2.5 Pro预览模型进行了更新,新版本在编程任务上表现出更强的能力。这次更新基于大约一个月前发布的Gemini 2.5 Pro版本,谷歌表示新模型将在未来几周内全面推出,目前已经在其AI开发平台AI Studio、Vertex AI以及Gemini应用中上线。 新的Gemini 2.5 Pro在其编程能力方面继续领先同类模型,特别在难度较高的编程基准测试如Aider Polyglot中取得了优异的成绩。此外,该模型在评估数学、科学、知识和推理能力的高度挑战性基准测试中同样展现了顶尖的表现。例如,在GPQA钻石测试单次尝试中达到了86.4%的准确率,而多次尝试的准确率为90%。在数学领域AIME 2025考试中,无论是单次还是多次尝试,均超过了其他竞争模型的分数。 此次升级不仅仅是对编程能力的优化,谷歌还针对之前2.5 Pro版本的反馈意见进行了改进,特别是提高了模型输出的内容质量和结构,使Gemini 2.5 Pro能够“更加创意性地给出更好的格式化回答”。这意味着开发者现在可以获得更有用、更为直观的信息。 此外,新版本的Gemini 2.5 Pro在事实性和视觉推理方面的表现也有所提升,例如在SimpleQA基准上的准确率达到了54%,而Vibe-Eval(Reka)图像理解测试中的得分也有67.2%。值得注意的是,Gemini 2.5 Pro还可以接受多种数据类型的输入,包括文本、图像、视频和音频,同时支持高达100万的输入token和6.4万个输出token,这是为了确保它能够处理更复杂的应用场景,适应不同企业的需求。 谷歌为新模型增添了功能调用、结构化输出、搜索工具和代码执行等工具使用选项。为了帮助开发者更好地控制成本和延迟,还在AI Studio和Vertex AI中引入了“思考预算”的概念。这不仅提高了模型的灵活性,也增强了用户的控制力,使得企业能够在不同的性能需求与经济考量之间找到平衡点。 总体来看,Gemini 2.5 Pro的改进旨在使其成为适用于各种企业规模应用的强大多功能模型,特别是在复杂的编程任务上。这一更新反映了谷歌在人工智能领域的持续投入与创新,并为开发者提供了更为强大的工具。 Gemini系列是谷歌推出的先进AI模型之一,自2022年起不断迭代优化,成为了业界领先的多模态大型语言模型。此次Gemini 2.5 Pro的升级不仅仅是技术上的进步,更是谷歌对市场反馈的积极响应。该模型的推出,预计将进一步推动人工智能在编程、科学计算等多个领域的应用,促进技术创新和发展。根据行业专家分析,这种高性能模型的普及将有助于降低企业的开发成本,加速产品上市时间。

Related Links