HyperAI

Visuell Verkörpertes Gehirn

Das Visual Embodied Brain (VeBrain) ist ein neues universelles, verkörpertes intelligentes Gehirn-Framework, das vom Shanghai Artificial Intelligence Laboratory und mehreren Teams im Jahr 2025 vorgeschlagen wurde.Visual Embodied Brain: Multimodale große Sprachmodelle in Räumen sehen, denken und steuern lassen".

Die herkömmliche Robotersteuerung umfasst in der Regel komplexe Sensoreingaben, Bewegungsplanung, dynamische Modellierung usw., also technische Steuerungsprobleme auf niedriger oder mittlerer Ebene. Die Innovation von VeBrain besteht darin, das ursprünglich komplexe Robotersteuerungsproblem in eine „bildsprachliche“ Aufgabe umzuwandeln, für die multimodale Großsprachenmodelle gut geeignet sind. So können Wahrnehmung, Argumentation und Steuerung in einem einheitlichen Rahmen erfolgen, sodass Roboter „sehen, denken und handeln“ können.