NVIDIA AI基盤、45℃液体冷却を採用
NVIDIAは世界で初めてサーバー内の全コンポーネントを完全液冷で冷却する次世代AIインフラプラットフォーム「Rubin」とDSX AIファクトリの参照設計を発表した。同システムは冷却液の動作温度上限を45℃まで引き上げる設計となっており、高い冷却水温度を活用してエネルギー消費と水資源消費を劇的に削減する。 従来のデータセンターでは冷却コストが電力使用量の最大40%を占めていたが、液冷方式の採用により冷却水温度を1℃上昇させるごとに冷却コストが約4%削減される。50メガワットのハイパースケール施設では年間で冷却関連コストを400万ドル以上節約できる試算だ。冷却液は水75%とプロピレングリコール25%の混合液で構成され閉鎖ループ内で循環するため、適切な気候条件下では機械式チラーや乾燥冷却装置のみで熱を放出可能となる。これにより従来方式で年260万ガロン以上使用されていた冷却用水を事実上ゼロに抑え、外部気温の影響を受けずにサーバーを安定稼働させる基盤を提供する。 技術面ではGPUやCPUのみならずネットワーク構成要素を含めた全コンポーネントの液冷化を達成。冷却液は直接チップ上のコールドプレートに流入し、45℃で進入した冷却液が約55℃で排出される過程で熱を吸収する。この方式により従来必須とされていた冷却ファンや冷温列の仕切りを撤廃し、騒音を大幅に低減した。また、ラック占有ユニット数が6Uから2Uへ縮小したことでスペース効率と計算密度が向上し、廃熱回収による周辺施設への暖房供給なども可能となる。 Schneider Electricの冷却部門MotivairのCEOリチャード・ホワイトモア氏は、チップあたりの発熱密度が上昇するにつれて液冷が必須となり業界全体のインフラ設計が転換期にあると指摘する。NVIDIAは配管経路を簡素化するシングルインレットアウトレット方式の開発に成功し、シール性の高い前面パネル設計と一体化したラックトレイ冷却アーキテクチャを完成させた。AI計算需要の爆発的増加に対し、この45℃液冷システムはエネルギー制約と環境負荷を同時に解決する新たな業界基準として、クラウドプロバイダー全体の移行を促進していく。
