谷歌Gemini 2.5 Flash新增“思考预算”功能,精准控制AI推理程度
谷歌近日推出了其最新的人工智能模型Gemini 2.5 Flash的升级版,该版本加入了一项名为“思考预算”的新功能,允许开发人员自由调整模型在执行任务时的思考程度。该功能旨在帮助解决新一代“推理”模型对计算资源的高要求问题,使模型更加高效和灵活。 这项升级于4月17日对外发布,是对3月推出的Gemini 2.5模型的进一步优化。此前, Gemini 2.5因其强大的推理能力,被称作谷歌迄今为止最智能的AI模型之一。然而,这种高性能的推理能力也带来了高昂的计算成本。为了解决这一问题,谷歌决定赋予开发人员更多的控制权,让他们可以根据实际需求来设定模型的思考强度,甚至可以选择让模型停止思考。 谷歌Gemini的产品管理总监Tulsee Doshi在博客中解释了这一功能的意义。“并不是所有的任务都需要相同水平的推理。比如,回答‘加拿大有多少个省’和让AI计算特定尺寸的悬臂梁的最大弯曲应力所需的推理能力就有很大不同。”Doshi说,“通过设置思考预算,开发人员可以找到质量、成本和延迟之间的最佳平衡点。” 新功能的具体实现方式是,开发人员可以为每次查询设定一个思考预算,用于控制模型生成数据的单位数量(即令牌数)。这种方式不仅提高了计算资源的使用效率,也使得模型可以根据不同任务的需求,灵活地调整其思考和推理的过程。例如,对于简单的问题,可以设置较低的思考预算,以减少响应时间和计算成本;而对于复杂问题,则可以设置较高的思考预算,确保模型能够提供高质量的答案。 谷歌的这一举措反映了人工智能行业内对计算资源利用效率的日益重视。近来,多家公司都在推出新的推理模型,这些模型力求在提高性能的同时,降低对计算资源的需求。例如,OpenAI在4月16日刚刚发布了类似的o3模型,而中国初创公司DeepSeek也在1月推出了一款号称使用更少计算资源的推理模型。这些技术进步不仅有助于提高计算资源的利用率,也使AI模型的商业应用更加广泛。 业内人士认为,谷歌的这一新功能将有望进一步推动AI技术的发展。通过给予开发人员更多的控制权,该功能不仅提高了模型的性能,还降低了其运行成本,为AI模型的广泛应用铺平了道路。谷歌在AI领域的持续创新和布局,充分体现了其在科技行业的领先地位和技术实力。作为全球领先的科技公司,谷歌一直以来都在不断探索和开发新的AI技术,为用户提供更加智能的服务和解决方案。
