Command Palette
Search for a command to run...

要約
本稿では、地球上で最も要求の高い現実世界環境の一つである海洋水中における身体的エージェント(embodied agents)のための、初めての包括的ベンチマークである「OceanGym」を紹介する。陸上や空中領域とは異なり、水中環境は視界の悪さや動的な海流といった極めて厳しい知覚および意思決定の課題を伴い、効果的なエージェントの展開は極めて困難である。OceanGymは、8つの現実的なタスク領域と、マルチモーダル大規模言語モデル(MLLM)によって駆動される統一されたエージェントフレームワークを備えており、知覚、記憶、順次的意思決定を統合している。エージェントは光学およびソナーデータを理解し、複雑な環境を自律的に探索し、厳しい条件下で長期的な目標を達成する必要がある。広範な実験の結果、最先端のMLLM駆動エージェントと人間の専門家との間に顕著な性能差が明らかとなり、海洋水中環境における知覚、計画、適応性の持続的な課題が浮き彫りになった。高忠実度かつ厳密に設計された本プラットフォームを提供することで、OceanGymは強靭な身体的AIの開発および実世界の自律型水中航行機(AUV)への能力転移のための実験台を確立し、地球の最後の未開拓領域の一つである水中環境で動作可能な知能エージェント実現に向けた決定的な一歩を示している。コードおよびデータは、https://github.com/OceanGPT/OceanGym にて公開されている。