HyperAIHyperAI

Command Palette

Search for a command to run...

Console
6 天前

机器人世界模型:用于机器人鲁棒策略优化的神经网络模拟器

Chenhao Li Andreas Krause Marco Hutter

机器人世界模型:用于机器人鲁棒策略优化的神经网络模拟器

摘要

学习鲁棒且具有泛化能力的世界模型,对于实现在真实环境中高效、可扩展的机器人控制至关重要。本文提出一种新颖的框架,用于学习能够准确捕捉复杂、部分可观测且具有随机性的动态行为的世界模型。所提出的方法采用双自回归机制与自监督训练策略,在无需依赖特定领域归纳偏置的前提下,实现了可靠的长时程预测,从而确保在多种机器人任务间具备良好的适应性。此外,我们进一步设计了一种策略优化框架,利用世界模型在虚拟环境中高效训练,并实现向真实系统中的无缝部署。本研究通过解决长时程预测、误差累积以及“仿真到现实”迁移等关键挑战,推动了基于模型的强化学习的发展。所提出的可扩展且鲁棒的框架,为真实应用场景中自适应、高效的机器人系统奠定了坚实基础。

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
机器人世界模型:用于机器人鲁棒策略优化的神经网络模拟器 | 论文 | HyperAI超神经