Command Palette
Search for a command to run...
시각 언어 행동 모델(VLA)
날짜
태그
비전-언어-행동(VLA)은 시각적 인식, 언어 이해 및 로봇 동작 제어를 심층적으로 통합한 다중 모드 지능형 시스템입니다.
VLA(Visual Alignment)는 시각 입력과 자연어 명령을 기반으로 로봇이 실행할 수 있는 동작 순서 또는 제어 전략을 엔드투엔드 학습을 통해 직접 생성합니다. VLA의 핵심 장점은 강력한 장면 이해 및 일반화 능력에 있으며, 이를 통해 로봇은 가정 서비스 및 산업 현장과 같은 복잡하고 역동적인 실제 환경에서 개방형 명령으로 작업을 완료할 수 있습니다. 이는 일반적인 체화된 지능을 구현하는 핵심적인 방법 중 하나입니다.