2 个月前

机器人技术

Chenhao Li Andreas Krause Marco Hutter

摘要

学习鲁棒且具有泛化能力的世界模型，对于实现在真实环境中高效、可扩展的机器人控制至关重要。本文提出一种新颖的框架，用于学习能够准确捕捉复杂、部分可观测且具有随机性的动态行为的世界模型。所提出的方法采用双自回归机制与自监督训练策略，在无需依赖特定领域归纳偏置的前提下，实现了可靠的长时程预测，从而确保在多种机器人任务间具备良好的适应性。此外，我们进一步设计了一种策略优化框架，利用世界模型在虚拟环境中高效训练，并实现向真实系统中的无缝部署。本研究通过解决长时程预测、误差累积以及“仿真到现实”迁移等关键挑战，推动了基于模型的强化学习的发展。所提出的可扩展且鲁棒的框架，为真实应用场景中自适应、高效的机器人系统奠定了坚实基础。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

2 个月前

机器人技术

Chenhao Li Andreas Krause Marco Hutter

摘要

学习鲁棒且具有泛化能力的世界模型，对于实现在真实环境中高效、可扩展的机器人控制至关重要。本文提出一种新颖的框架，用于学习能够准确捕捉复杂、部分可观测且具有随机性的动态行为的世界模型。所提出的方法采用双自回归机制与自监督训练策略，在无需依赖特定领域归纳偏置的前提下，实现了可靠的长时程预测，从而确保在多种机器人任务间具备良好的适应性。此外，我们进一步设计了一种策略优化框架，利用世界模型在虚拟环境中高效训练，并实现向真实系统中的无缝部署。本研究通过解决长时程预测、误差累积以及“仿真到现实”迁移等关键挑战，推动了基于模型的强化学习的发展。所提出的可扩展且鲁棒的框架，为真实应用场景中自适应、高效的机器人系统奠定了坚实基础。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

机器人世界模型：用于机器人鲁棒策略优化的神经网络模拟器 | 论文 | HyperAI超神经