HyperAI超神経

視覚的具体化脳

Visual Embodied Brain (VeBrain) は、上海人工知能研究所と複数のチームによって 2025 年に提案された新しい汎用的な具現化されたインテリジェント脳フレームワークです。視覚的具体化脳:マルチモーダル大規模言語モデルで空間を視覚化し、思考し、制御する”。

従来のロボット制御は、複雑なセンサー入力、動作計画、動的モデリングなど、低レベルまたは中レベルのエンジニアリング制御問題を伴うのが一般的です。VeBrainの革新性は、元々複雑なロボット制御問題を、マルチモーダル大規模言語モデルが得意とする「絵話」タスクに変換し、知覚、推論、制御を統一されたフレームワークの下で完結させることにあります。これにより、ロボットは「見て、考えて、行動する」ことができます。