NVIDIA 확장하는 추론 모델 생태계, CrowdStrike·Uber·Zoom 등 기업들 AI 에이전트와 물리적 AI에 본격 적용
NVIDIA는 SIGGRAPH에서 AI 에이전트와 물리적 AI 시스템을 위한 고성능 추론 모델 ‘NVIDIA Nemotron’과 ‘Cosmos Reason’의 신규 버전을 공개했다. 이 모델들은 기업과 물리 세계에서의 자율성 향상을 위한 핵심 기반으로, CrowdStrike, Uber, Zoom, NetApp, Magna 등 주요 기업들이 이미 도입해 활용 중이다. Nemotron Nano 2와 Llama Nemotron Super 1.5는 과학적 추론, 수학, 코딩, 도구 호출 등에서 크기 대비 최고의 정확도를 보이며, 60% 낮은 추론 비용으로 빠르고 효율적인 결정을 가능하게 한다. 특히 NVFP4 형식은 NVIDIA B200 GPU에서 H100 대비 최대 6배 높은 처리 속도를 제공한다. 이를 통해 AI 에이전트는 복잡한 다단계 작업을 독립적으로 수행할 수 있다. 또한, Cosmos Reason은 70억 파라미터의 개방형 추론 비전 언어 모델로, 물리 세계의 물리 법칙, 객체 지속성, 시공간 정렬을 이해하는 데 특화되어 있다. 이는 로봇의 의사결정, 자율주행차의 시나리오 분석, 공장·도시 환경의 실시간 비디오 분석 등에 활용되며, VAST, Ambient.ai, Centific 등이 이를 기반으로 사고형 AI 에이전트를 개발 중이다. NVIDIA는 Nemotron과 Cosmos Reason을 NIM 마이크로서비스로 제공해 보안성과 제어력을 확보하고, AWS Bedrock, Azure AI Foundry, Oracle, Google Vertex AI 등 주요 클라우드 플랫폼에서도 곧 이용 가능하게 할 예정이다. 사용자는 build.nvidia.com, Hugging Face, GitHub에서 모델을 다운로드할 수 있다. 이들 모델은 2028년까지 AI 에이전트로 인한 수익 증대와 비용 절감으로 최대 4500억 달러의 경제적 가치를 창출할 것으로 전망된다.