人工智能新战场:从聊天机器人到浏览器的转变
人工智能从聊天机器人迈向浏览器 随着现代人工智能技术的蓬勃发展,人们通常会首先想到像ChatGPT这样的聊天机器人。然而,越来越多的迹象表明,浏览器才是下一阶段AI技术发展的关键领域。原因很简单,当前的聊天机器人并没有像浏览器那样能够访问用户在线生活的能力,这是将其发展为能够为你完成任务的有效工具所必需的上下文信息,比如对你的电子邮件和银行账户的读取与写入权限。 最近,两个产品发布为这种趋势提供了有力证据。首先是OpenAI推出的ChatGPT Agent,它能够代理用户上网浏览。紧随其后的是Perplexity公司的桌面浏览器Comet,该产品不仅能在用户登录的状态下访问网站,还能代表用户完成一些简单的在线任务。(据传,OpenAI也在计划推出自己的全功能浏览器。)尽管这两个产品目前都存在不少问题和限制,比如性能不稳定,需要高昂的订阅费用才能使用,甚至是它们有时候会声称完成了并未真正完成的任务。但是,从行业的发展速度和潜力来看,这些问题很可能会在未来得到解决。 ChatGPT Agent是一个基于浏览器的体验,目前只能用于读取网页信息,不能在登录状态下操作网站,如添加购物车等功能,这大大限制了它的实用性。而且它的速度非常慢,例如我的同事Hayden让ChatGPT Agent在Etsy上找一款灯,花费了近50分钟才回应,且未能正确执行添加到购物车的操作。相比之下,Comet虽然没有如此缓慢,但仍会在某些情况下声称已经完成了未实际完成的任务,或是在接受任务请求时立即表示无法完成。不过,Comet的侧边栏界面对于只读任务来说,如总结网页内容或针对特定网页进行研究,表现得相当出色。 Perplexity公司的CEO阿凡德·斯里尼瓦斯在本周的一个访谈中提到,他看好通过推理模型的进步来克服这些挑战。OpenAI为ChatGPT Agent定制了一个复杂的推理模型,专门用于处理需要多步骤的复杂任务。(这个模型目前尚未公开命名,也不通过API提供给公众)。即便现在这两款产品有诸多局限,几天使用下来我依然确信,主流的聊天机器人界面将会与浏览器融合。单纯的聊天机器人界面似乎已经不够“智能”,而通过浏览器交互的AI体验则更能模拟出真正的助手感觉。尽管聊天机器人的应用仍然广泛,特别是在智能手机上,但浏览器的这一变革将解锁一种真正能为用户提供个性化帮助的人工智能服务。 除了AI浏览器领域的动态,其他一些值得关注的消息包括Substack拒绝了Vice创始人Shane Smith提出的收购提议,尽管后者提出了投资建议。此次谈判具体进展如何仍是个谜,但无疑显示出创业公司在面对大公司求购时的态度。此外,Big Tech公司在AI人才市场上也表现得异常活跃,Facebook的新智能实验室o1近期吸纳了多位AI行业的顶尖人物,其中包括5名OpenAI的“基础贡献者”。特斯拉最近也遭受了更多的人才流失,北美销售负责人Troy Jones离开了这家电动汽车制造商。 业界对于这种浏览器与AI结合的新模式普遍持乐观态度,认为这是一个充满潜能的方向。与此同时,AI行业的快速变化也在不断引发人才流向和公司战略的重大调整,预示着未来几年该领域将有更多突破性进展。 (编者注:NeurlPS会议由于签证问题为美国参会者增设了墨西哥分会场,显示出AI国际交流面临的挑战。)