HyperAI

谷歌在 Pixel 10 Pro 和 Galaxy S26 Ultra 上测试了 Gemini 的新任务自动化功能，允许 AI 自动操作应用。该功能目前处于测试阶段，仅限部分外卖和网约车应用。尽管体验尚显缓慢且偶尔笨拙，无法解决所有痛点，但它标志着首款能在手机端真正执行任务的 AI 助理问世，被视为未来的雏形。实测发现，Gemini 操作速度远慢于人类，且有时需要数分钟才能完成简单任务。它会自动在后台运行，屏幕底部会显示操作进度，例如自动选择餐品份量或寻找配菜。虽然处理过程有时会出现错误绕路，甚至难以识别屏幕上的选项，但它最终能自行修正并完成任务。功能设计默认在后台运行，需用户手动开启观看界面。为防止意外，AI 会在确认下单前暂停，由用户最终审核，测试中从未发生失控下单的情况。最具代表性的案例是用户通过自然语言指令让 Gemini 规划行程：它成功从日历和邮件中提取航班信息，结合地理位置推算出最佳出发时间，并自动在 Uber 上预订了接驾服务，全程仅耗时三分钟。这展示了自然语言交互与传统数字助手的本质区别，即能够理解复杂意图而非仅执行命令。然而，当前测试暴露了为人类设计的应用界面并不适合 AI 直接操作，AI 容易受广告和视觉干扰。行业正致力于通过模型上下文协议（MCP）等技术，让应用向 AI 开放数据接口，而非让 AI 模仿人类点击。谷歌安卓主管指出，目前的自动化是过渡方案，旨在推动开发者采用更高效的 API 接入方式。尽管目前体验不够完美，但这标志着移动助理进入了一个新的里程碑。

相关链接

相关链接

相关链接

零代码自主发现科学图像处理算法，美阿贡国家实验室提出 CVEvolve，具备写代码/结果自查/策略优化等全栈能力

零代码自主发现科学图像处理算法，美阿贡国家实验室提出 CVEvolve，具备写代码/结果自查/策略优化等全栈能力

Command Palette

Gemini 任务自动化虽慢却令人惊叹

相关链接

Command Palette

Gemini 任务自动化虽慢却令人惊叹

相关链接

Command Palette

Gemini 任务自动化虽慢却令人惊叹

相关链接

零代码自主发现科学图像处理算法，美阿贡国家实验室提出 CVEvolve，具备写代码/结果自查/策略优化等全栈能力

零代码自主发现科学图像处理算法，美阿贡国家实验室提出 CVEvolve，具备写代码/结果自查/策略优化等全栈能力