Gemini 首次登陆 Chrome:初探谷歌的代理化AI助手
谷歌在Chrome浏览器中集成了其AI助手Gemini,这标志着该公司在打造更智能、更主动的AI代理方面迈出了一步。Gemini按钮位于Chrome的右上角,点击后即可启动对话。目前,这项功能仅限于AI Pro或AI Ultra订阅用户,并且需要使用Chrome的Beta、Dev或Canary版本。早期版本的Gemini已经展现了一些实用的功能,例如可以“看”到屏幕上的内容,并根据用户的当前位置提供相关帮助。 用户可以通过Gemini快速获取网页上的信息。在我尝试的过程中,Gemini能够准确地为The Verge的文章做摘要,还能找到Nintendo为Switch Online服务新增的Game Boy游戏、Elden Ring电影改编的消息以及Valve对Steam Deck的重大更新。值得一提的是,为了让Gemini看到特定的部分,如The Verge的评论区,用户需要首先滚动页面让这部分可见,否则Gemini无法识别和回复。此外,Gemini还可以跨标签页跟随用户,但每次只能处理一个页面的信息。 虽然Gemini的回答有时显得过长,导致在Chrome的小弹窗中阅读不太方便,但这仍然是一个有潜力的功能。AI的核心优势之一是节省时间,提供快速简洁的答案。然而, Gemini在某些情况下未能做到这一点,除非用户明确要求简短回答。Gemini还会提出跟进问题,诸如是否想了解更多某一话题的信息,这些提问有些重复,但也说明它试图更好地理解和响应用户的需求。 尽管存在不一致性和一些小问题,Gemini在Chrome中的集成显示出谷歌希望将其AI打造成更加主动的代笔者。Gemini未来可能会具备更多类似于代理的任务执行能力,例如帮用户预订餐厅、保存旅行相关的书签,或是自动把YouTube上的不同食谱视频添加到观看稍后面列。随着“代理模式”的引入,Gemini的桌面应用将能管理多达10个任务,谷歌似乎正逐步向这个目标迈进,未来不排除将这些功能带到Gemini在Chrome中的集成版本。