波士顿动力与丰田研究所联手突破人形机器人技术,Atlas实现通用任务学习新飞跃
波士顿动力与丰田研究所近日联合宣布,其在人形机器人智能化领域取得关键突破。通过将大型行为模型(Large Behavior Models, LBMs)应用于旗下Atlas人形机器人,双方成功实现机器人从“预编程执行”向“自主学习与适应”的范式转变。这一进展标志着通用任务处理机器人迈出了实质性一步。 传统机器人依赖工程师为每种场景编写精确指令,不仅耗时费力,且行为极易因环境微小变化而失效。为突破这一瓶颈,研究团队开发了一种端到端的AI策略系统,将感知、决策与控制整合于单一神经网络中,使Atlas能够协调全身动作,完成复杂任务。在演示视频中,Atlas自主完成一系列连贯操作:走近装有Spot机器人零件的推车,抓取并折叠机械腿,精准放置于货架;随后取出面板,拉开抽屉,分类收纳;最后处理散落的零件,转移至另一辆推车。整个过程涵盖移动、抓取、折叠、放置、开合等多重动作,展现强大的长序列任务执行能力。 更值得关注的是其应对突发状况的适应性。当研究人员故意合上箱子或掉落零件时,Atlas并非僵化中断,而是主动尝试打开箱盖或俯身拾起,展现出初步的“纠错”与问题解决能力。这种灵活性并非来自预设代码,而是源于模型在训练中学习了包含干扰与恢复行为的多样化人类演示数据。 核心技术依托于一个基于扩散Transformer架构的4.5亿参数模型,其训练数据通过虚拟现实遥操作系统采集。操作员佩戴VR设备,以第一视角实时操控Atlas完成任务,系统同步记录视觉图像、本体感觉数据及语言指令。这些多模态数据被用于训练通用策略模型,而非为单一任务定制专用模型。通过整合来自Atlas完整机体、上半身测试台及其他机器人平台的跨任务、跨平台数据,模型具备更强的泛化能力,可灵活应对不同物体(如工具、布料、轮胎)和环境变化。 此外,该系统在执行效率上也实现显著提升——部署后动作速度可达原始人类演示的1.5至2倍,部分场景甚至超越人类操作员表现。这得益于波士顿动力与丰田研究所构建的“模拟-物理”闭环开发体系:新策略先在高保真仿真环境中大规模测试验证,再部署至实体机器人,大幅降低试错成本与硬件损耗。 尽管前景广阔,挑战依然存在。大规模高质量数据的获取仍面临成本与效率难题,且从实验室突破到实际应用还需跨越安全、成本与可靠性等多重门槛。但此次合作标志着人形机器人正从“特定任务执行者”迈向“通用智能体”的关键转折点,为未来家庭服务、工业协作与应急救援等场景的应用奠定了坚实基础。
