HyperAI超神经

谷歌在Chrome浏览器中集成了其AI助手Gemini，这标志着该公司在打造更智能、更主动的AI代理方面迈出了一步。Gemini按钮位于Chrome的右上角，点击后即可启动对话。目前，这项功能仅限于AI Pro或AI Ultra订阅用户，并且需要使用Chrome的Beta、Dev或Canary版本。早期版本的Gemini已经展现了一些实用的功能，例如可以“看”到屏幕上的内容，并根据用户的当前位置提供相关帮助。用户可以通过Gemini快速获取网页上的信息。在我尝试的过程中，Gemini能够准确地为The Verge的文章做摘要，还能找到Nintendo为Switch Online服务新增的Game Boy游戏、Elden Ring电影改编的消息以及Valve对Steam Deck的重大更新。值得一提的是，为了让Gemini看到特定的部分，如The Verge的评论区，用户需要首先滚动页面让这部分可见，否则Gemini无法识别和回复。此外，Gemini还可以跨标签页跟随用户，但每次只能处理一个页面的信息。虽然Gemini的回答有时显得过长，导致在Chrome的小弹窗中阅读不太方便，但这仍然是一个有潜力的功能。AI的核心优势之一是节省时间，提供快速简洁的答案。然而， Gemini在某些情况下未能做到这一点，除非用户明确要求简短回答。Gemini还会提出跟进问题，诸如是否想了解更多某一话题的信息，这些提问有些重复，但也说明它试图更好地理解和响应用户的需求。尽管存在不一致性和一些小问题，Gemini在Chrome中的集成显示出谷歌希望将其AI打造成更加主动的代笔者。Gemini未来可能会具备更多类似于代理的任务执行能力，例如帮用户预订餐厅、保存旅行相关的书签，或是自动把YouTube上的不同食谱视频添加到观看稍后面列。随着“代理模式”的引入，Gemini的桌面应用将能管理多达10个任务，谷歌似乎正逐步向这个目标迈进，未来不排除将这些功能带到Gemini在Chrome中的集成版本。

相关链接

相关链接

相关链接

视觉真实之外：清华 WorldArena 全新评测体系揭示具身世界模型的能力鸿沟

视觉真实之外：清华 WorldArena 全新评测体系揭示具身世界模型的能力鸿沟

Command Palette

Gemini 首次登陆 Chrome：初探谷歌的代理化AI助手

相关链接

Command Palette

Gemini 首次登陆 Chrome：初探谷歌的代理化AI助手

相关链接

Command Palette

Gemini 首次登陆 Chrome：初探谷歌的代理化AI助手

相关链接

视觉真实之外：清华 WorldArena 全新评测体系揭示具身世界模型的能力鸿沟

视觉真实之外：清华 WorldArena 全新评测体系揭示具身世界模型的能力鸿沟