Back to Headlines

NVIDIA Blackwell Ultra: The Breakthrough Chip Driving the AI Factory Revolution

13일 전

NVIDIA는 새로운 차세대 GPU ‘Blackwell Ultra’를 공개하며 AI 팩토리 시대의 핵심 인프라를 선도할 계획을 밝혔다. 이 칩은 TSMC 4NP 공정으로 제작되며, 2080억 개의 트랜지스터를 내장하고, 두 개의 리티클 크기 다이를 고대역폭 인터커넥트(NV-HBI)로 연결해 10TB/s의 데이터 전송 속도를 구현한다. 이로 인해 단일 CUDA 프로그램으로 관리 가능한 초대용량 GPU가 됐다. 주요 성능 향상은 다섯 번째 세대 Tensor 코어와 4비트 부동소수점 형식 NVFP4 도입에 있다. NVFP4는 FP8보다 메모리 사용을 약 8배 줄이며, 정확도는 거의 동등해 대규모 추론에서 높은 효율과 빠른 응답 시간을 가능하게 한다. Blackwell Ultra는 NVFP4 기준으로 15페타플롭스 성능을 제공해 Hopper H100 대비 7.5배 빠르다. 또한, 어텐션 레이어의 핵심 연산인 소프트맥스를 처리하는 SFU 성능이 두 배로 향상돼, 긴 컨텍스트를 처리하는 추론 모델의 지연을 획기적으로 줄였다. 메모리 측면에서는 288GB의 HBM3E를 탑재해 트리리언 파라미터 모델을 한 칩에서 직접 실행할 수 있으며, NVLink 5와 PCIe Gen 6를 통해 GPU 간 및 CPU와의 고속 통신을 지원한다. 이 칩은 NVIDIA Grace CPU와 결합된 ‘Grace Blackwell Ultra Superchip’으로 구성된 GB300 NVL72 랙 규모 시스템에서 최적의 성능을 발휘하며, 엔터프라이즈용 관리 기능과 보안 기능도 갖춰 실용화에 적합하다. 이는 AI 팩토리의 생산성과 효율성을 혁신적으로 끌어올리는 기반이 된다.

Related Links

NVIDIA Blackwell Ultra: The Breakthrough Chip Driving the AI Factory Revolution | 헤드라인 | HyperAI초신경