HyperAI초신경

엔비디아 중국 공식 홈페이지, 4090 삭제…칩 수출 금지 범위 확대…A40, A6000 등재

일 년 전
정보
h.li
特色图像

01 미국 상무부의 중국 반도체 수출에 대한 새로운 규정이 공식 발효되었습니다.

11월 16일(현지 시간) 미국 상무부 산업안보국(BIS)이 발표한 반도체 및 반도체 장비에 대한 새로운 수출 제한 조치(이하 칩 수출 제한 조치)가 공식 발효되었습니다.

BIS는 10월 17일에 새로운 규칙을 업데이트했으며, 고급 공정을 필요로 하는 고성능 컴퓨팅 칩과 반도체 장비에 대한 중국의 구매를 더욱 제한하는 것을 목표로 합니다. 미국 상무부 장관 지나 라이몬도는 직설적으로 다음과 같이 말했습니다.금지 조치의 목적은 "인공지능과 고성능 컴퓨팅(AI 및 HPC) 분야에서 획기적인 발전을 가져올 수 있는 첨단 반도체에 대한 중국의 접근을 제한하는 것"입니다.

11월 17일, NVIDIA의 중국 공식 웹사이트는 RTX 4090 그래픽 카드와 관련된 콘텐츠를 삭제했습니다.

두 개의 웹 페이지 스냅샷을 보면 GeForce RTX 40 시리즈 그래픽 카드 소개 페이지에서 4090 관련 콘텐츠가 제거되었고, 원래 디스플레이에 사용된 RTX 4090 렌더링도 RTX 4080으로 대체된 것을 알 수 있습니다.

이러한 변화는 미국 상무부가 10월 17일에 발표한 새로운 규정에 따른 직접적인 대응으로, 이 규정은 중국으로의 고급 AI 칩 수출을 엄격히 제한합니다.NVIDIA의 고성능 GPU 제품군인 A100, H100, A800, H800, L40, L40S와 많은 기대를 모았던 4090이 포함됩니다.

10월 중순에서 말, 정책 공개 기간 동안 미국 상무부는 중국으로의 A800과 H800 수출을 즉시 중단했습니다.

02 델 판매 문서 유출:A40, A6000, 4090은 모두 금지 목록에 있습니다.

미국이 중국으로의 칩 수출에 대한 제한을 발표한 이후, 업계의 불확실성과 긴장은 계속해서 고조되었습니다. 11월 17일, 긴장은 최고조에 달한 듯했다.

Dell의 판매 문서에는 금지된 국가, 제품 모델, 지침 및 기타 정보가 자세히 설명되어 있습니다. 최종적으로 검토를 통과하지 못한 Nvidia GPU 목록에는 이전에 예상했던 A100, H100, A800, H800, L40S, L40 및 기타 그래픽 카드가 포함되었습니다.A30, A40, L4, RTX A6000도 추가되었습니다.그 중에서도 많은 기대를 모았던 RTX 4090도 목록에 올랐습니다.

국내 소비자 커뮤니티에서도 4090이 판매 금지 품목에 포함되는지에 대한 논의가 확정 단계에 이르렀습니다.

Dell 판매 문서: 금지 국가, 제품 모델, 지침 및 제안 등의 자세한 목록

금지된 다른 제품에는 AMD와 Intel의 칩 몇 가지가 포함됩니다.

이 중 AMD의 제한 제품에는 MI210, MI250, MI250X 및 모든 MI300 시리즈 제품을 포함한 서버 수준 GPU와 소비자 등급 그래픽 카드 RX7900 XTX, W7900 및 RX7900XT가 포함됩니다.

Intel의 경우, 이러한 제한은 모든 기존 Gaudi 제품과 모든 PVC 및 PCB 보드/Max, Flex 시리즈 제품에 적용됩니다.

NVIDIA의 제한된 GPU 모델은 컴퓨팅 코어와 메모리 크기 측면에서 다음과 같이 분포됩니다.

대규모 언어 모델(LLM)은 계산 과정에서 대용량 비디오 메모리와 높은 대역폭 속도가 필요합니다. vLLM 및 xinference와 같은 주요 LLM 추론 프레임워크는 일반적으로 NVIDIA를 sm75까지 지원하거나 심지어 sm80까지만 지원합니다.

금지 조치가 A6000과 A40으로 확대된 이후, NVIDIA가 현재 생산 중인 모든 고용량 메모리 제품이 영향을 받았습니다. 제한된 컴퓨팅 성능은 심각하지만, 비디오 메모리 지원의 부족은 훨씬 더 치명적입니다.대형 모델을 칩에 로딩하는 데 상당한 영향을 미칠 것입니다.

또한 RTX 4090, A30, L4 등의 칩의 비디오 메모리는 작지만,그러나 int8 단일 지표에서는 300Tops 이상의 컴퓨팅 파워만 제공할 수 있기 때문에,원래 금지할 의도가 없었음에도 불구하고 이러한 GPU 모델이 제한 목록에 포함되는 결과가 발생했습니다.

추론 중 주류 모델 매개변수에 필요한 메모리 크기:

제한된 사양의 칩을 얻을 수 없다면 매개변수 규모가 300억 이상인 LLM은 추론 과정에서 더 많은 칩을 사용해야 할 것이라는 점을 알 수 있습니다.그러나 카드 간 상호 연결은 모델 운영 비용을 크게 증가시키고 추론 효율성을 떨어뜨려 실제 AI 구현에서 LLM을 적용하는 데 심각한 영향을 미칠 것입니다.

또한 4090과 같은 소비자용 그래픽 카드는 매우 높은 비용 효율성 덕분에 많은 과학 연구 기관에서 실제로 기초 과학 연구에 사용되고 있습니다.

300Tflops(최대) 이상의 컴퓨팅 지수와 높은 비디오 메모리를 갖춘 제품을 차단함으로써 미국 상무부가 칩 금지 지수를 낮추려는 의도가 매우 분명해졌습니다. 실제 목적은 두 가지입니다.중국 인공지능 산업에서 대규모 언어 모델의 연구 개발과 대규모 응용을 제한하는 동시에, 중국 과학 연구계의 AI 연구 기반을 억제합니다.

03 엔비디아의 대체 제품들은 성능이 좋지 않습니다.:LLM의 추론 요구 사항을 충족하기 어려움

11월 13일, 미국이 중국에 대한 고성능 AI 칩 수출을 통제한 데 대응하여 NVIDIA는 중국 시장을 겨냥해 특별히 설계된 HGX H20, L20 PCIe, L2 PCIe 등 3개의 새로운 AI 칩을 출시할 것이라고 확인했습니다.이 새로운 칩의 성능은 미국 수출 규정을 준수하기 위해 회사의 주력 제품인 H100 시리즈에 비해 상당히 낮습니다.

특히 AI 모델 학습의 요구를 충족하도록 설계된 HGX H20 칩은 대역폭과 컴퓨팅 속도가 제한되어 있으며, 전체 컴퓨팅 성능은 H100 GPU 칩보다 약 80% 낮을 것으로 예상됩니다.이러한 성능 조정으로 인해 HGX H20의 컴퓨팅 성능은 H100의 5분의 1로 낮아졌습니다.

세 칩 모두 미국 수출 금지 규정을 준수하지만, 성능은 5~6년 전의 엔비디아 Volta와 Turing 아키텍처와만 비슷합니다.이 두 세대의 제품은 2~3년 이상 단종되었습니다.

엔비디아, 중국에 대한 미국 칩 수출 제한 준수 위해 거세 칩 3종 출시

Hopper 코어 칩에는 Attention 아키텍처를 위한 전용 가속 장치가 내장되어 있지만, 이는 DSA 아키텍처와 비슷합니다.그러나 거세 이후에도 핵심 추론 LLM의 속도는 여전히 크게 감소할 것입니다.이로 인해 구매 회사의 비용이 상당히 증가하게 됩니다.

또한 미국 상무부는 H800 및 A800 간소화된 버전에 대한 판매 금지 정책을 변경했습니다.만약 H20의 LLM 최적화가 우수한 성능을 유지한다면, 다시 금지 목록에 포함될 가능성이 있습니다.

04 국내 독자적인 산업체인 구축이 시급하다

2021년부터 TSMC와 다른 국제 칩 제조업체는 미국 당국에 "정보 요청"을 제출해야 했습니다.요청에는 주요 고객 목록, 재고, 수익 분배 등의 핵심 정보가 포함됩니다.

2023년 10월미국의 중국에 대한 반도체 제재 금지 조치는 화웨이, 캠브리안 등의 제조업체에 이어 무어 스레드와 비렌 테크놀로지까지 확대되었습니다.컴퓨팅 지표에서 300Tflops 또는 Tops가 넘는 기타 국내 칩은 미국 통제 금지 조치에 따른 컴퓨팅 지표보다 낮을 수 있지만, 중국을 견제하려는 미국의 의도에 영향을 미치기 때문에 여전히 개입 대상이 됩니다.

금지로 인해 영향을 받는 칩 해시레이트 지표

이러한 배경 속에서 중국의 칩 산업은 중요한 전환점에 직면해 있습니다.

인공지능과 첨단 과학 연구 분야에서 경쟁력을 유지하고 개발 병목 현상을 극복하기 위해 중국은 독립적이고 통제 가능한 R&D 체인 구축을 가속화해야 합니다.이 과정은 핵심기술의 연구개발 강화뿐만 아니라, 소재·설계·제조·포장·시험 등 다양한 측면에서 자립을 달성하여 외부 요인으로 인해 과학기술의 진보가 방해받지 않도록 하는 것이 필요합니다.

이러한 목표는 쉽지 않지만, 중국이 장기적인 기술적 안보와 산업의 지속 가능한 발전을 보장할 수 있는 유일한 방법입니다.