HyperAI초신경
Back to Headlines

AMD, 2035년 제타스케일 슈퍼컴퓨터는 원자력 발전소급 전력 필요

20일 전

AMD는 2025년 국제 슈퍼컴퓨팅 회의에서 인공지능(AI) 가속기 개발의 제한 요인, 특히 이러한 최첨단 칩의 전력 요구량 증가에 대해 논의했습니다. ComputerBase 보도에 따르면, AMD는 미래의 제타플롭(ZettaFLOP) 수준의 슈퍼컴퓨터가 원자력 발전소와 동일한 양의 에너지를 필요로 할 것으로 예상하고 있습니다. AMD는 2010년부터 2015년 사이에 슈퍼컴퓨터가 3.2GF/W의 전력을 소비하며 작동했다고 공개한 그래프를 통해 2035년까지 슈퍼컴퓨터의 전력 소모량 증가 추세를 예측했습니다. 이 그래프는 직선으로 2035년까지 연장되며, AMD는 제타스케일 슈퍼컴퓨터가 2140GF/W의 전력을 소비할 것으로 예측합니다. 이는 약 500메가와트(MW)의 전력, 즉 37만 5천 가구를 공급할 수 있는 에너지에 해당합니다. 이 그래프는 2.2년마다 AI 프로세서 개발 효율성이 2배 향상된다는 가정 하에 작성되었습니다. 메모리 대역폭과 냉각 용량이 전력 소모량 증가의 주요 원인으로 지목되고 있습니다. AI 하드웨어의 계산 능력이 증가함에 따라, 메모리 대역폭과 데이터센터 냉각 시스템도 그에 맞춰 확대되어야 합니다. 이로 인해 데이터센터 전반에서 전력 소모량이 계속 증가하는 눈덩이 효과가 발생합니다. 또한, FP128, FP64, FP16, FP8 등의 계산 능력에 대한 수요가 이 문제를 더욱 복잡화시키고 있습니다. FP64와 FP128는 우수한 정확성을 제공하지만, 일부 작업은 FP16과 FP8에서 더 유용하게 실행됩니다. 따라서 향후 AI 가속기는 저정밀 연산을 수행할 수 있어야 합니다. 현재 최신 AI 가속기들의 전력 소모량이 급증하고 있습니다. Nvidia의 B200는 1000W의 TDP(열설계전력)를 가지고 있으며, AMD의 새로운 MI355X는 1400W의 TDP를 가지고 있습니다. 반면, 5년 전 Nvidia의 A100 플래그십 AI GPU는 400W의 전력만 소비했습니다. 이는 RTX 5090보다도 적은 전력입니다. 미국 정부는 이와 같은 에너지 문제를 원자력 발전소를 통해 해결하려는 노력을 하고 있습니다. 또한 Microsoft 같은 큰 기업들은 데이터센터의 전력 문제를 해결하기 위해 핵융합에 막대한 투자를 하고 있습니다. 현재 슈퍼컴퓨터들은 엑사플롭(ExaFLOP) 수준에 머물러 있으며, AMD MI300A 기반의 ElCaptain 슈퍼컴퓨터가 세계에서 가장 빠른 슈퍼컴퓨터로 알려져 있습니다. 그러나 완전한 AI 데이터센터 농장은 이미 제타플롭(ZettaFLOP) 성능을 도달하고 있으며, Oracle이 131,072개의 Blackwell GPU를 사용하여 2.4 제타플롭의 성능을 자랑하는 첫 번째 제타스케일 클라우드 컴퓨팅 클러스터를 제공하였습니다. 산업 내부자들은 이 예측이 현실화될 경우, 데이터센터의 전력 소모량 문제가 심각한 사회적 이슈로 부각될 수 있을 것으로 평가하고 있습니다. 원자력 발전소나 핵융합과 같은 대안적인 에너지 공급 방식이 필수적으로 고려되어야 할 것으로 보이며, 이를 통해 데이터센터의 지속 가능한 운영이 가능해질 것으로 기대됩니다. AMD와 같은 기술 기업들은 이러한 문제를 해결하기 위한 연구와 개발에 계속 투자하고 있으며, 미래의 AI 기술 발전을 위한 중요한 역할을 하고 있습니다.

Related Links