HyperAIHyperAI

Command Palette

Search for a command to run...

Gemini Robotics-ER 1.6:以增强具身推理赋能现实机器人任务

Google 近日发布 Gemini Robotics-ER 1.6 模型,旨在通过增强的具身推理能力,推动机器人从单纯指令执行向理解物理世界进化。该模型作为机器人系统的高级决策核心,专注于视觉与空间理解、任务规划及成功检测等关键环节,能够自主调用工具、视觉语言动作模型或第三方函数来完成任务。 Gemini Robotics-ER 1.6 在空间推理和物理理解方面较其前代版本及 Gemini 3.0 Flash 有显著提升,特别是在指向、计数和任务成功判定等能力上表现优异。尤为引人注目的是,该模型新增了对仪表读数的理解能力,使机器人能够识别复杂的压力计和液位观察窗,这一突破源于 Google 与波士顿动力的紧密合作。通过强化多视角理解能力,新版本为实现下一代物理智能体的高度自主性奠定了基础。 即日起,开发者可通过 Gemini API 和 Google AI Studio 访问该模型。为加速应用落地,Google 还发布了包含配置示例的 Colab 笔记本,协助开发者快速上手进行具身推理任务。分析师认为,这一升级将大幅缩短机器人从实验室走向实际场景的周期,使机器人在工业导航、设备检测等复杂环境中更具实用价值,同时进一步巩固了 Google 在人工智能与机器人融合领域的领先地位。

相关链接