情報
h.li
現地時間11月16日、米国商務省産業安全保障局(BIS)が発令したチップおよび半導体装置の輸出制限に関する新たな規制(以下、チップ輸出制限)が正式に発効した。
この新たな規制はBISが10月17日の最新情報で提案したもので、中国による高度なプロセスを伴うハイエンドコンピューティングチップや半導体装置の購入をさらに制限することを目的としている。米国商務長官ジーナ・ライモンドは率直にこう言った。禁止の目的は、中国の「人工知能と高性能コンピューティング(AIとHPC)の進歩を促進する可能性のある先端半導体へのアクセス」を制限することだ。
11 月 17 日、NVIDIA の公式中国語 Web サイトは RTX 4090 グラフィックス カードに関連するコンテンツを削除しました。
2 つの Web スナップショット レコードは、GeForce RTX 40 シリーズ グラフィックス カードの紹介ページから 4090 関連のコンテンツが削除され、元々表示に使用されていた RTX 4090 レンダリングも RTX 4080 に置き換えられたことを示しています。
この変更は、10月17日に米国商務省が発行した、ハイエンドAIチップの中国への輸出を厳しく制限する新たな規制に直接対応したものである。NVIDIA の高性能 GPU 製品ライン - A100、H100、A800、H800、L40、L40S、および待望の 4090 が含まれます。
これに先立ち、米国商務省は10月中旬から下旬、政策発表期間中の中国へのA800とH800の輸出を直接かつ即時停止していた。
米国による中国へのチップ輸出制限の発表後、業界の不確実性と緊張は高まり続けている。 11月17日、この緊張は頂点に達したように見えた。
デルの販売文書には、禁止されている国、製品モデル、ガイダンス、推奨事項などの詳細情報が記載されており、最終的に審査に合格しなかった Nvidia GPU のリストには、以前に予想されていた A100、H100、A800、H800、L40S、L40 およびその他のモデル グラフィックスだけが含まれていませんでした。カード、A30、A40、L4、RTX A6000も追加されており、その中には、待望のRTX 4090もリストに含まれています。
4090が禁止リストに含まれるかどうかに関する国内の消費者コミュニティでの議論も明確な結論に達しました。
デルの販売文書: 禁止されている国、製品モデル、ガイダンスと提案などの詳細なリスト。
その他の禁止製品には、AMD や Intel のさまざまなチップが含まれます。
その中で、AMD の制限付き製品には、MI210、MI250、MI250X およびすべての MI300 シリーズ製品を含むサーバー グレードの GPU と、コンシューマ グレードのグラフィックス カード RX7900 XTX、W7900、および RX7900XT が含まれます。
インテルの場合、この制限はすべての既存の Gaudi 製品に加え、すべての PVC および PCB ボード/Max および Flex シリーズ製品にも影響します。
コンピューティング コアとメモリ サイズに関する NVIDIA 制約付き GPU モデルの分布:
Large Language Model (LLM) は、計算プロセス中に、より大きなグラフィックス メモリとより高い帯域幅レートを必要とします。vLLM、xinference などの主流の LLM 推論フレームワークは、通常、sm75 まで、または sm80 までの NVIDIA をサポートします。
禁止措置が A6000 および A40 まで拡大された後、現在 Nvidia が製造しているすべてのハイグラフィックス メモリ製品が影響を受けました。コンピューティング パフォーマンスの制限は深刻ですが、ビデオ メモリのサポートがないことはさらに致命的です。チップへの大きなモデルのロードは大きな影響を受けます。
さらに、RTX 4090、A30、L4 などのチップのビデオ メモリは小さいですが、ただし、int8 単一インジケーターのみが 300Tops 以上の計算能力を提供できるため、これらの GPU モデルも、当初は禁止される予定ではなかったにもかかわらず、制限リストに含まれていました。
推論プロセス中に主流モデルのパラメーターに必要なビデオ メモリの量:
制限された仕様のチップが入手できない場合、パラメータ規模が 300 億を超える LLM は、推論動作中により多くのチップを使用することを余儀なくされることがわかります。カード間の相互接続は、モデルの運用コストを大幅に増加させ、推論効率を低下させるため、実際の AI 実装における LLM の適用に深刻な影響を及ぼします。
また、4090などの民生用グラフィックスカードは、コストパフォーマンスが非常に高いため、多くの科学研究機関で基礎科学研究の実践に実際に使用されています。
高グラフィックス メモリと 300Tflops (Tops) を超える任意のコンピューティング指標を備えた製品をブロックすることにより、チップ禁止指標を引き下げるという米国商務省の意図が明確になります。その実際の目的は次の 2 つです。中国の科学研究コミュニティのAI研究基盤を抑制しながら、中国の人工知能産業における大規模言語モデルの研究開発と大規模応用を制限する。
11 月 13 日、米国による中国に対する高性能 AI チップの輸出規制に対応して、NVIDIA は、中国市場向けに特別に設計された 3 つの新しい AI チップ、HGX H20、L20 PCIe、および L2 PCIe を発売することを確認しました。これらの新しいチップの性能は、米国の輸出規制に準拠するために、同社の主力製品である H100 シリーズと比較して大幅に低下しています。
特に、HGX H20 チップは AI モデルのトレーニングのニーズを満たすように設計されており、その帯域幅と計算速度は制限されており、全体の計算能力は H100 GPU チップよりも約 80% 低いと予想されます。このようなパフォーマンス調整により、HGX H20 の計算能力は H100 のわずか 5 分の 1 になります。
3 つのチップはすべて米国の輸出禁止措置を遵守していますが、そのパフォーマンスは 5 ~ 6 年前の Nvidia の Volta および Turing アーキテクチャに匹敵するものにすぎません。これら 2 世代の製品は、2 ~ 3 年以上前に製造中止されました。
Nvidiaは、米国と中国のチップ輸出規制に準拠するために、チップの3つの去勢バージョンを発売する予定
ただし、Hopper コア チップには、DSA アーキテクチャに似たアテンション アーキテクチャ専用のアクセラレーション ユニットが組み込まれています。ただし、去勢されたコア推論 LLM の速度は依然として大幅に低下します。これは調達会社のコストの大幅な増加につながります。
さらに、米国商務省は、いずれも簡易版である H800 および A800 の販売禁止にいくつかの変更を加えました。H20 による LLM の最適化によって優れたパフォーマンスが維持される場合、再び禁止リストに含まれるのではないかと思います。
2021年以降、TSMCなどの国際的なチップメーカーは米国当局に「情報要請」を提出することが義務付けられている。リクエストには、主要顧客のリスト、在庫、収益分配などの重要な情報が含まれます。
2023年10月米国による中国へのチップ制裁・禁止の対象は、ファーウェイ、カンブリアンなどに続き、ムーア・スレッドとビレン・テクノロジーにも追加された。いずれかの計算指標で 300Tflops または Tops を超えるその他の国産チップは、米国の規制禁止の計算指標よりも低い可能性がありますが、米国の中国封じ込めの意図に影響を与えるため、依然として介入の対象となります。
禁止の影響を受けるチップコンピューティング能力指標
こうした背景から、中国のチップ産業は重大な転換点を迎えている。
競争力を維持し、人工知能と先端科学研究の分野における開発のボトルネックを打破するために、中国は独立した制御可能な研究開発リンクの構築を加速する必要がある。このプロセスでは、コア技術の研究開発を強化するだけでなく、技術の進歩が外部要因によって妨げられないように、材料、設計、製造、パッケージング、テストのすべての側面で自給自足を達成することも必要です。
この目標は課題に満ちているが、中国にとっては長期的な技術安全保障と産業の持続可能な発展を確保する唯一の方法である。