HyperAIHyperAI

Command Palette

Search for a command to run...

谷歌 Gemini Pro 再破纪录:刷新基准测试新高

谷歌周四发布了其最新版本的Gemini Pro模型——Gemini 3.1 Pro,目前处于预览阶段,即将全面上线。该模型被广泛认为是目前最强大的大语言模型之一,性能较前代产品实现显著跃升。此前发布的Gemini 3已在11月亮相,已展现出极强的AI能力,而Gemini 3.1 Pro则在此基础上进一步优化,尤其在多步推理和复杂任务处理方面表现突出。 谷歌公布了多项独立基准测试结果,包括备受关注的“人类最后的考试”(Humanity’s Last Exam)测试,结果显示Gemini 3.1 Pro在多项指标上大幅超越前代版本,展现出更强的综合智能水平。此外,AI初创公司Mercor的CEO Brendan Foody在其自研的APEX基准测试系统中指出,Gemini 3.1 Pro已登顶APEX-Agents排行榜。他评价称,这一成绩反映出AI代理在真实专业工作场景中能力的快速进步。 此次发布正值AI模型竞争白热化阶段。各大科技公司正加速推出具备更强推理能力与自主执行能力的新型大模型。OpenAI和Anthropic等企业近期也相继发布了新一代模型,推动AI向更复杂的“代理式”应用演进。谷歌此次更新不仅巩固了其在AI领域的技术地位,也进一步加剧了全球AI竞赛的激烈程度。

相关链接

谷歌 Gemini Pro 再破纪录:刷新基准测试新高 | 热门资讯 | HyperAI超神经