HyperAI

구글이 'Gemini Robotics On-Device'를 발표하며, 로봇 AI 모델의 완전한 로컬 환경 실행을 처음으로 실현했습니다. 이 모델은 개발자가 자세한 요구사항과 사용 환경에 맞게 모델을 개선할 수 있도록 설계되었습니다. 연구 결과, 단지 50~100개의 새로운 태스크 시연만으로도 모델이 빠르게 학습하고 새로운 기술을 습득할 수 있으며, 강력한 "빠른 태스크 적응" 능력을 보여주었습니다. 이 모델의 유니버설 적용성을 증명하기 위해, 구글은 다양한 물리적 로봇에서의 성능을 시연했습니다. 초기에 주로 구글의 ALOHA 양손 로봇에서 훈련되었지만, 팀은 이를 여러 제3자 로봇에 성공적으로 적합시켰습니다. 이 중에는 독일 프랑카 에미카(Franka Emika) 회사의 협동 로봇과 앱트로닉(Apptronik) 회사가 개발한 인체형 로봇 아폴로(Apollo)가 포함되었습니다. 아폴로는 "검은색 T셔츠를 가방에 넣어주세요" 또는 "마술사를 가방에 넣어주세요" 등의 지시를 받으면, 목표물을 정확히 식별하고 해당 작업을 완료할 수 있었습니다. 그러나 이러한 강력한 AI 모델이 물리적 실체를 제어하는 능력을 갖추면서, 안전성 문제에 대한 우려도 제기되었습니다. 파라다(Parada)는 생성식 AI가 출력물에 일정 정도의 불확실성이 존재한다고 지적했습니다. 이것은 채팅봇에서는 무해한 창의적인 문장들을 생성할 수 있지만, 물리적 로봇에게는 심각한 안전 문제를 유발할 수 있습니다. 이에 대해 구글은 On-Device 모델 자체가 핵심적인 VLA(대용량 언어 모델)만 포함하고, 전체적인 안전 프레임워크는 포함하지 않는다는 점을 강조했습니다. 구글은 개발자가 내부 팀이 채택한 다층 안전 전략을 복제하고 추천하도록 권장합니다. 이를 위해 모델은 본지의 Gemini Live API와 연결되어, 내장된 안전층을 통해 언어와 내용을 검토하고, 안전하지 않거나 부적절한 지시를 걸러낼 수 있습니다. 동시에, 중요한 것은 개발자가 로봇 하드웨어 레벨에서 저수준의 안전 컨트롤러를 장착하여, 로봇의 동작 범위와 힘 등을 실시간으로 감시하고 제한하는 것이 마지막 방어선이 된다는 것입니다. 구글은 또한 개발자가 발표한 언어 안전 기준에 따라 "레드팀 테스트(red-teaming)"를 진행하여, 안전상의 잠재적 오류를 사전에 폭로하고 수정하도록 격려하고 있습니다. 현재 구글은 "임의의 테스터 계획"을 시작하여, 유능한 개발자와 연구원들이 새로운 Gemini Robotics On-Device 모델과 그에 맞는 소프트웨어 개발 도구 패키지를 사용해보도록 초청했습니다. 이 도구 패키지는 MuJoCo 물리 시뮬레이터를 포함하여, 개발자가 가상 시뮬레이션 환경에서 대량의 테스트와 튜닝을 수행한 후 실제 로봇에 적용할 수 있도록 편의를 제공합니다. 더 나아가, 이 모델은 아직 초기 단계에 불과합니다. 파라다에 따르면, 현재의 Gemini Robotics 모델은 Gemini 2.0 버전을 기반으로 구축되었으며, 구글의 로봇 팀은 보통 Gemini 모델의 개발 속도를 넘어서는 새로운 버전을 준비하고 있습니다. 최신의 Gemini 2.5 버전의 성능 향상을 고려할 때, 다음 세대 로봇 모델의 성능도 크게 향상될 것으로 기대됩니다. 이 업데이트는 AI와 로봇 기술 분야에서 중요한 발전을 이룬 것으로, 많은 전문가들은 로봇 기술의 미래에 긍정적인 영향을 미칠 것이라고 평가하고 있습니다. 구글의 이러한 접근 방식은 개발자들이 안전성을 유지하면서 더 복잡하고 다양한 로봇 응용 프로그램을 만드는 데 도움이 될 것으로 보입니다. 구글의 로봇 부서는 이미 여러 프로젝트에서 이 모델을 활용하고 있으며, 앞으로도 이 기술을 더욱 발전시키기 위해 노력할 것으로 예상됩니다.

구글, 로봇 AI 모델 첫 현지화 발표

Related Links