Command Palette
Search for a command to run...
젠슨 황의 최근 연설: 5가지 혁신, 루빈 성능 데이터 최초 공개; 에이전트/로봇/자율주행/AI4S를 아우르는 다양한 오픈 소스

새해를 맞아 '기술의 봄 축제'로 불리는 CES 2026(소비자 가전 전시회)이 미국 라스베이거스에서 개막했습니다. 생체공학, 휴머노이드 로봇, 자율주행 기술이 전시회의 중심을 이룬 가운데, 인텔, AMD, 퀄컴, 엔비디아 등 주요 제조사들의 치열한 경쟁과 새로운 칩 공개 또한 CES의 주요 볼거리였습니다.
여러 소식통에 따르면 인텔은 CES에서 3세대 코어 울트라 프로세서인 팬서 레이크(Panther Lake)를 공식 출시할 예정입니다. 퀄컴은 PC용 스냅드래곤 X2 엘리트(Snapdragon X2 Elite)와 스냅드래곤 X2 엘리트 익스트림(Snapdragon X2 Elite Extreme) 플랫폼의 최신 개발 사항을 선보일 것입니다. AMD CEO 리사 수는 1월 5일 저녁 기조연설에서 최근 유출된 라이젠 7 9850X3D와 젠 5 아키텍처 기반의 라이젠 9000G 시리즈를 포함한 새로운 라이젠 칩을 공개할 계획입니다.
젠슨 황은 CES 공식 기조연설자 명단에는 없었지만, 여러 행사에 참석하며 바쁜 일정을 소화했습니다. 특히 주목할 만한 것은 1월 5일 베이징 시간 오전 5시에 진행된 NVIDIA LIVE 단독 발표였습니다. 황은 이 발표에서 루빈 플랫폼의 최신 개발 현황과 물리 AI 및 자율 주행 관련 기술 발전을 공개할 것으로 예상됩니다.
젠슨 황은 업계의 기대를 저버리지 않았습니다. 최근 마무리된 그의 연설에서,특유의 검은색 가죽 재킷을 입은 라오 황은 다섯 가지 혁신 기술이 적용된 루빈 플랫폼을 소개하고, 여러 오픈 소스 성과를 공개했습니다.구체적으로:
* 에이전트형 AI를 위한 NVIDIA Nemotron 시리즈
* NVIDIA 코스모스 플랫폼(물리적 AI용)
* 자율주행 연구개발을 위한 NVIDIA Alpamayo 시리즈
* 로봇 공학 분야를 위한 NVIDIA Isaac GR00T
* NVIDIA Clara, 생의학 분야에 기여
다섯 가지 혁신적인 기능을 갖춘 Rubin은 완벽한 시기에 등장했습니다.
"인공지능 학습 및 추론에 필요한 연산량이 현재 급격히 증가하고 있는 가운데, 루빈의 이번 발표는 시기적으로 매우 적절합니다."젠슨 황은 루빈 플랫폼에 대해 큰 기대를 걸고 있으며, 루빈은 현재 본격적인 운영 단계에 있으며 2026년 하반기에 첫 번째 사용자들에게 제공될 예정이라고 밝혔습니다.
플랫폼 성능에 초점을 맞춰, 루빈 플랫폼은 NVIDIA Vera CPU, NVIDIA Rubin GPU, NVIDIA NVLink 6 스위치, NVIDIA ConnectX-9 SuperNIC, NVIDIA BlueField-4 DPU, 그리고 NVIDIA Spectrum-6 이더넷 스위치를 포함한 6개의 칩에 걸쳐 "극한의 공동 설계"를 구현했습니다. 이를 바탕으로 NVIDIA Blackwell 플랫폼과 비교했을 때,이 기술은 추론 단계에서 토큰당 비용을 최대 10배까지 줄이고, MoE(하이브리드 전문가) 모델 학습에 필요한 GPU 수를 4배까지 줄일 수 있습니다.
그중 NVIDIA Spectrum-6 이더넷은 200G SerDes, 코패키징 광학 장치, AI에 최적화된 네트워크 아키텍처를 적용한 차세대 AI 네트워크용 이더넷으로, 루빈의 AI 팩토리에 더욱 높은 효율성과 뛰어난 복원력을 제공합니다. Spectrum-6 아키텍처 기반의 Spectrum-X 이더넷 광 스위칭 시스템은 5배의 에너지 효율을 달성하는 동시에 10배의 신뢰성과 5배 더 긴 가동 시간을 제공합니다.

공식 소개에 따르면 Rubin 플랫폼은 다섯 가지 혁신 기능을 제공합니다.
6세대 NVIDIA NVLink
대규모 MoE 모델을 위한 고속의 원활한 GPU-GPU 통신을 제공합니다. 단일 GPU 대역폭은 3.6TB/s에 달하며, Vera Rubin NVL72 랙의 총 대역폭은 260TB/s로 인터넷 전체 대역폭을 능가합니다. NVLink 6 스위치 칩은 네트워크 컴퓨팅 기능을 통합하여 집계 통신을 가속화하고 유지 관리 및 복원력 측면에서 새로운 기능을 도입함으로써 더욱 빠르고 효율적인 대규모 AI 학습 및 추론을 가능하게 합니다.
* NVIDIA Vera CPU
에이전트 추론에 특화된 이 CPU는 대규모 AI 팩토리에서 가장 에너지 효율이 뛰어납니다. 88개의 NVIDIA Olympus 코어를 사용하고 Armv9.2와 완벽하게 호환되며 초고속 NVLink-C2C 인터커넥트를 지원하여 최신 데이터 센터 워크로드에 탁월한 성능, 대역폭 및 업계 최고 수준의 에너지 효율을 제공합니다.

* NVIDIA Rubin GPU
3세대 트랜스포머 엔진을 탑재하고 하드웨어 가속 적응형 압축을 지원하는 이 제품은 AI 추론에서 50 PFLOPS의 NVFP4 컴퓨팅 성능을 제공합니다.
* 3세대 NVIDIA 기밀 컴퓨팅
Vera Rubin NVL72는 랙 레벨에서 NVIDIA 기밀 컴퓨팅을 구현한 최초의 플랫폼으로, CPU, GPU 및 NVLink 영역 전반에 걸쳐 데이터 보안을 보장하고 세계 최대 규모의 독점 모델과 해당 모델의 학습 및 추론 작업을 보호합니다.
* 2세대 RAS 엔진
GPU, CPU 및 NVLink를 포괄하는 실시간 상태 모니터링, 내결함성 및 예측 유지 관리 메커니즘은 시스템 생산성을 극대화합니다. 모듈식 무선 트레이 설계로 블랙웰보다 최대 18배 빠른 조립 및 유지 관리 속도를 제공합니다.

한편, Rubin 플랫폼은 기가비트급 추론 컨텍스트 확장을 지원하도록 설계된 새로운 AI 네이티브 스토리지 인프라인 NVIDIA 추론 컨텍스트 메모리 스토리지 플랫폼을 소개합니다. NVIDIA BlueField-4 기반의 이 플랫폼은 AI 인프라 내에서 키-값 캐시 데이터의 효율적인 공유 및 재사용을 가능하게 하여 응답성과 처리량을 향상시키는 동시에 예측 가능하고 저전력의 에이전트 AI 확장을 구현합니다.
Rubin 플랫폼은 아직 정식 출시되지 않았지만, 이미 여러 업계 리더들의 지지를 얻고 있습니다. NVIDIA 공식 블로그 게시물에서 OpenAI CEO 샘 알트만, Anthropic CEO 다리오 아모데이, Meta CEO 마크 저커버그, (xAI CEO로 등장한) 일론 머스크, 그리고 마이크로소프트, 구글, AWS, 델과 같은 주요 기술 기업의 CEO들이 모두 Rubin 플랫폼을 극찬했습니다. 머스크는 특히 다음과 같이 언급했습니다."루빈은 다시 한번 NVIDIA가 업계 최고의 기준임을 세계에 증명할 것입니다."

다양한 오픈 소스 기술: 에이전트, AI4S, 자율 주행, 로봇 공학
많은 논란을 불러일으킨 루빈 플랫폼 외에도, 젠슨 황의 연설에서 또 다른 핵심 단어는 "오픈 소스"였습니다.

첫 번째는 NVIDIA Nemotron for AI Agents입니다. NVIDIA는 이전에 출시된 NVIDIA Nemotron 3 오픈 모델 및 데이터를 기반으로 음성, 멀티모달 검색 증강 생성(RAG) 및 보안을 위한 Nemotron 모델을 추가로 출시했습니다.
* 네모트론 음성
새로운 ASR(자동 음성 인식) 모델을 포함한 여러 주요 오픈 소스 모델로 구성된 이 시스템은 실시간 캡션 생성 및 음성 AI 애플리케이션을 위한 저지연 실시간 음성 인식 기능을 제공합니다. 일일 및 모달 벤치마크 결과, 유사 모델보다 10배 빠른 속도를 보여줍니다.
* 네모트론 RAG
이 버전에는 완전히 새로운 임베딩 모델과 재구성된 시각 언어 모델(VLM)이 포함되어 있어 고정밀 다국어 및 다중 모드 데이터 분석을 제공함으로써 문서 검색 및 정보 검색 기능을 크게 향상시킬 수 있습니다.
* 네모트론 안전
AI 애플리케이션의 보안 및 신뢰성을 강화하기 위해 설계된 모델 시스템에는 이제 더 많은 언어를 지원하는 Llama Nemotron 콘텐츠 보안 모델과 민감한 데이터를 높은 정확도로 식별할 수 있는 Nemotron PII가 포함됩니다.

둘째로, NVIDIA는 물리 AI 및 로봇 공학 분야를 위해 코스모스 시리즈 모델을 업데이트했습니다.
* 코스모스 이유 2
새롭게 최고 수준으로 평가받는 추론 기반 VLM은 로봇과 AI 에이전트가 물리적 세계에서 인지, 이해 및 상호 작용에 있어 더 높은 정확도를 달성하도록 지원합니다.
* 코스모스 트랜스퍼 2.5 및 코스모스 프리딕트 2.5
이 시스템은 다양한 환경과 조건에서 대규모 합성 비디오를 생성할 수 있습니다.
NVIDIA는 Cosmos를 기반으로 다양한 물리적 AI 패러다임을 위한 오픈 소스 모델도 공개했습니다.
* 아이작 GR00T N1.6
Cosmos Reason을 활용하여 전신 제어를 가능하게 하고 추론 및 상황 이해 능력을 향상시키는 휴머노이드 로봇용 개방형 추론 비전-언어-행동(VLA) 모델.
* NVIDIA Blueprint 비디오 검색 및 요약
NVIDIA Metropolis 플랫폼에 속하는 이 도구는 대량의 녹화 및 실시간 비디오를 분석하여 운영 효율성과 공공 안전을 향상시킬 수 있는 시각 AI 에이전트를 구축하기 위한 참조 워크플로를 제공합니다.

셋째, 자율주행 산업을 위해 NVIDIA는 오픈소스 모델, 시뮬레이션 도구 및 대규모 데이터 세트를 포함하는 NVIDIA Alpamayo를 새롭게 공개했습니다.
* 알파마요 1
자율주행차(AV)를 위한 최초의 오픈소스 대규모 추론 기반 VLA 모델은 차량이 주변 환경을 이해할 뿐만 아니라 자신의 행동을 설명할 수 있도록 합니다.
* 알파심
다양한 환경과 복잡한 엣지 시나리오에서 추론 기반 자율 주행 모델의 폐쇄 루프 학습 및 평가를 지원하는 오픈 소스 시뮬레이션 프레임워크입니다.
또한 NVIDIA는 전 세계 가장 광범위한 지리적 지역과 환경 조건에서 수집된 1,700시간 이상의 실제 주행 데이터를 포함하는 Physical AI 오픈 데이터셋을 공개했습니다. 이 데이터셋은 희귀하고 복잡한 실제 엣지 시나리오를 다수 포함하고 있어 추론 아키텍처 발전에 매우 중요합니다.

마지막으로, AI4S 분야에서 NVIDIA는 다음과 같은 기능을 포함하는 Clara AI 모델을 출시했습니다.
* 라-프로테이나
이는 과학 연구 및 신약 후보 물질 개발을 위한 대규모 원자 수준 단백질 설계를 지원하며, 이전에는 "치료 불가능"하다고 여겨졌던 질병을 연구하는 새로운 도구를 제공합니다.
* 리아신 v2
신약 개발 과정에 제조 설계도를 도입하면 AI로 설계된 약물이 합성적으로 실현 가능한지 확인할 수 있습니다.
* 케르모트
이 기술은 약물과 인체 간의 상호작용을 예측함으로써 초기 단계에서 매우 정확한 전산 안전성 테스트를 제공합니다.
* RNAPro
RNA 분자의 복잡한 3차원 구조를 예측하여 맞춤형 의학의 잠재력을 극대화합니다.
또한 NVIDIA는 연구자들이 더욱 정확한 AI 모델을 구축할 수 있도록 455,000개의 합성 단백질 구조가 포함된 데이터 세트를 공개했습니다.
결론
라스베이거스에서 다시 한번 AI와 그 기반이 되는 하드웨어 지원에 관심이 집중되는 가운데, 젠슨 황의 루빈 플랫폼에 대한 유려한 설명이나 리사 수의 주요 신제품 발표는 단순히 차세대 칩 출시나 성능 향상에 관한 것만이 아닙니다. 이는 AI 개발의 다음 단계를 위한 경계를 설정하는 데 더 큰 의미가 있습니다. 즉, 컴퓨팅 파워를 어떻게 조직하고, 비용을 어떻게 절감하며, 모델을 어떻게 진정한 추론 단계로 나아가게 하고, 에이전트를 현실 세계와 어떻게 긴밀하게 연결할 것인가에 대한 문제입니다.
CES 2026은 더 이상 단순히 제조사 간의 사양 경쟁이 아니라, AI 인프라의 형태를 둘러싼 공동의 선택의 장입니다. 경쟁의 초점이 모델 자체에서 누가 더 효율적이고 안정적으로 대규모 인텔리전스 배포를 지원할 수 있느냐로 옮겨가고 있다는 것이 분명합니다.
참고 자료
1.https://nvidianews.nvidia.com/news/rubin-platform-ai-supercomputer
2.https://blogs.nvidia.com/blog/open-models-data-tools-accelerate-ai/








