HyperAI超神经

视觉具身大脑框架 Visual Embodied Brain

视觉具身大脑框架(Visual Embodied Brain,简称 VeBrain)是上海人工智能实验室联合多个团队于 2025 年共同提出的一种全新的通用具身智能大脑框架,相关论文成果为「Visual Embodied Brain: Let Multimodal Large Language ModelsSee, Think, and Control in Spaces」。

传统机器人控制通常涉及复杂的传感器输入、运动规划、动力学建模等,属于低级或中级的工程控制问题。 VeBrain 的创新点在于:它把原本复杂的机器人控制问题转化成了多模态大语言模型擅长的「看图说话」任务,这样就能在一个统一的框架下完成感知、推理和控制,使机器人可以「看到、思考、行动」。