ChatGPT代理初体验:购物助手潜力巨大但速度缓慢且功能有限
OpenAI近期推出了其新产品ChatGPT Agent,这被认为是人工智能代理领域的一大进步。ChatGPT Agent能够完成用户委托的各种复杂、多步骤的任务,如购物、研究和日程安排等。它结合了OpenAI之前发布的Operator和Deep Research工具的功能,并通过一个所谓的“虚拟计算机”来执行这些任务。为了体验这款新工具,《The Verge》支付了200美元购买了一个月的ChatGPT Pro订阅服务。 ChatGPT Agent的表现如何呢?简而言之,它可以部分完成任务,但速度极其缓慢,可靠性也不高,而且存在一些技术故障。在初次尝试中,我选择了“在Etsy上寻找价格低于200美元的日式复古台灯”的示例任务。ChatGPT Agent用了大约50分钟的时间完成了这项任务,包括思考、设置桌面、查找和筛选搜索结果等步骤。然而,尽管代理声称已将选定物品添加到我的购物车中,但实际上并没有成功。这是因为ChatGPT Agent无法访问或控制用户的浏览器和登录信息,而是将商品添加到了它的虚拟电脑上。尽管如此,它还是提供了商品链接供我手动比较。 在讨论财务交易时,ChatGPT Agent表现出了更多的局限性。当要求它登录我的银行账户并设置每月自动转账至储蓄账户时,代理表示它不能执行这样的操作,因为它没有权限处理敏感的银行账户管理。尽管如此,代理在周三的一次私人展示和与OpenAI员工Yash Kumar和Isa Fulford的产品和技术说明会上指出,ChatGPT Agent可以协助处理标准结账流程中的消费者购买行为,比如购买食品杂货和家庭用品等,但不能执行涉及高风险金融事务的任务。 随后,我又试着让ChatGPT Agent为住在科罗拉多州的朋友Alanna购买鲜花。虽然代理能迅速提供几个选项,并根据价格和花束大小进行评估,但它依然无法直接下单。当我要求它从其中一个推荐的本地花艺网站选择具体的花束并完成订购时,代理再次遇到了问题。尽管已经提到了该网站,但它表示需要我提供确切的网址才能进一步行动。最终,ChatGPT Agent只能指导我完成这一过程,而不是替我执行。 ChatGPT Agent可以在分析和比较选项上表现出色,但它似乎无法完全履行自己的主要职责——替用户完成实际操作。由于它是在自己的虚拟计算机环境中运行,这极大限制了其在现实中的应用场景和效果。代理可以自动化处理一些有趣且私人的流程(如挑选特定花束和撰写温馨寄语),却无法应对最为繁琐的部分(如实填交付信息和进行付款)。 业内专家认为,ChatGPT Agent代表了AI助手发展的一个重要方向,即通过自动化处理日常任务来提高用户的生产效率。然而,当前版本的技术能力显然还远未达到商业应用的基本要求。尽管OpenAI在持续改进这个工具,但其未来的路还有很长,尤其是在处理与用户个人数据和安全相关的任务方面。 OpenAI是一家领先的人工智能研究机构,致力于开发能够推动科技进步的智能系统。ChatGPT Pro作为其高端订阅服务,旨在为用户提供更强大、更高效的AI助手功能。然而,这次推出的ChatGPT Agent虽然在某些方面令人印象深刻,但在用户体验和实际执行能力上仍需大幅提升。