Command Palette
Search for a command to run...

摘要
我们提出了 OceanGym,这是首个面向海洋水下具身智能体的综合性基准测试平台,旨在推动人工智能在地球上最具挑战性的现实环境之一中的发展。与陆地或空中领域不同,水下环境面临着极端的感知与决策难题,包括能见度低、海洋洋流动态变化等,使得智能体的有效部署尤为困难。OceanGym 包含八个高度逼真的任务领域,并采用由多模态大语言模型(MLLMs)驱动的统一智能体框架,该框架融合了感知、记忆与序列决策能力。智能体需理解光学与声呐数据,在复杂环境中自主探索,并在恶劣条件下完成长时程目标任务。大量实验表明,当前最先进的 MLLM 驱动智能体与人类专家之间仍存在显著差距,凸显了在海洋水下环境中实现感知、规划与适应能力的持续挑战。通过提供一个高保真、设计严谨的测试平台,OceanGym 为开发鲁棒的具身人工智能奠定了基础,并推动相关能力向真实世界自主水下航行器的迁移,标志着迈向能够在地球最后未被充分探索疆域中自主运行的智能体的重要一步。代码与数据已开源,详见:https://github.com/OceanGPT/OceanGym。