Gemini 任务自动化虽慢却令人惊叹
谷歌在 Pixel 10 Pro 和 Galaxy S26 Ultra 上测试了 Gemini 的新任务自动化功能,允许 AI 自动操作应用。该功能目前处于测试阶段,仅限部分外卖和网约车应用。尽管体验尚显缓慢且偶尔笨拙,无法解决所有痛点,但它标志着首款能在手机端真正执行任务的 AI 助理问世,被视为未来的雏形。 实测发现,Gemini 操作速度远慢于人类,且有时需要数分钟才能完成简单任务。它会自动在后台运行,屏幕底部会显示操作进度,例如自动选择餐品份量或寻找配菜。虽然处理过程有时会出现错误绕路,甚至难以识别屏幕上的选项,但它最终能自行修正并完成任务。功能设计默认在后台运行,需用户手动开启观看界面。为防止意外,AI 会在确认下单前暂停,由用户最终审核,测试中从未发生失控下单的情况。 最具代表性的案例是用户通过自然语言指令让 Gemini 规划行程:它成功从日历和邮件中提取航班信息,结合地理位置推算出最佳出发时间,并自动在 Uber 上预订了接驾服务,全程仅耗时三分钟。这展示了自然语言交互与传统数字助手的本质区别,即能够理解复杂意图而非仅执行命令。 然而,当前测试暴露了为人类设计的应用界面并不适合 AI 直接操作,AI 容易受广告和视觉干扰。行业正致力于通过模型上下文协议(MCP)等技术,让应用向 AI 开放数据接口,而非让 AI 模仿人类点击。谷歌安卓主管指出,目前的自动化是过渡方案,旨在推动开发者采用更高效的 API 接入方式。尽管目前体验不够完美,但这标志着移动助理进入了一个新的里程碑。
