OpenAI推出新ChatGPT Agent,可接管电脑并执行任务
OpenAI于本周四发布了最新的AI Agent 工具——ChatGPT Agent,旨在突破传统聊天机器人的局限,让用户更加便捷地完成复杂任务。这款工具集成了Operator和Deep Research的功能,可以在用户的虚拟计算机上独立操作,使用浏览器、应用程序等进行多步骤的任务处理,如查看日程表以提前通知用户即将举行的客户会议,规划和购买制作家庭早餐所需的食材,甚至是创建竞争对手分析的幻灯片。ChatGPT Agent的推出标志着OpenAI正积极扩展到更多实际应用场景,并尝试将其强大的AI能力更有效地服务人们的生活与工作。 参与此次项目的关键成员包括产品带头人Yash Kumar和研究带头人Isa Fulford,他们透露这个新模型是在专门用于此产品的研究基础上开发出来的,采用了强化学习技术来训练其完成需要多个软件协同工作的复杂任务。为了加速ChatGPT Agent的研发,OpenAI还特意整合了原有Operator与Deep Research两个团队的力量,组成了一个新的、规模介于20到35人之间的工作小组。 在The Verge的演示活动中,ChatGPT Agent展示了如何通过连接Google日历查找用户空闲的时间段,并结合OpenTable上的餐厅预订信息安排一次约会夜。同时,用户可以中途打断该流程,提出新增搜索条件,比如不同的餐厅类型。此外,ChatGPT Agent也能快速生成关于某一研究主题(如“Labubus相对于Beanie Babies的兴起”)的详细报告,证明了其在资料搜集方面的能力。 尽管功能强大,但这款工具仍存在一些不足之处,比如执行速度较慢、对于某些不可逆的操作(如发送邮件或作出预订)会事先征求用户的同意。目前,ChatGPT Agent不允许进行金融交易,除非用户允许。此外还有一个名为Watch Mode的安全措施,如果用户访问包含敏感信息的网站,如银行页面,则不能关闭或跳转聊天框,否则Agent将停止工作。 从长远来看,随着ChatGPT Agent的上线,订阅了Pro、Plus或Team计划的用户将能够率先体验这一前沿产品;而企业版和教育版的用户预计将在今年夏天末期迎来这一更新。值得注意的是,在欧洲经济区及瑞士等地区,具体的推广时间表尚未公布。 近年来,“AI代理”一直是人工智能行业的热点话题。理想中的AI代理人能够接管特定职能,优化日常事务管理,甚至基于好友偏好购买礼物等个性化服务。2023年,这一概念逐渐受到投资者和技术领导者的青睐。尤其是当2024年初Klarna宣布其AI代理仅用一个月便接管了三分之二的客户服务对话后,业界对此的关注达到顶峰。随后,亚马逊、Meta、谷歌等大型科技公司纷纷在其财报电话会议中表达了类似的技术愿景,并加大了对该领域的投入。就在上周,谷歌还招募了Windsurf的CEO及其部分研发团队成员,以进一步推进其在代理型AI领域的发展。 然而,即便取得了如此多的进步,AI代理的应用现状并不尽如人意。以Klarna为例,该公司曾短暂试验了全AI客户服务,但因工作质量不尽如人意,最终决定重新引入人类操作员。这说明,虽然AI代理展现出巨大潜力,但在精确性和可靠性方面还有很长的路要走。目前市场上已有几家主要AI企业提供了类似的服务,包括但不限于谷歌和Perplexity AI的Deep Research工具以及Anthropic的Computer Use服务,都在努力探索这一未来可能改变人类工作效率的新领域。