HyperAI

Est-il Difficile De Dissiper La Chaleur Dans Les Centres De Données ? Découvrez Comment Google Et DeepMind Utilisent L'ia Pour Résoudre Ce Problème

il y a 6 ans
Liste recommandée
Information
Dao Wei
特色图像

Par Super Neuro

Description du scénario :Google et DeepMind ont collaboré pour utiliser des méthodes d’apprentissage automatique afin d’optimiser la consommation d’énergie des centres de données et de parvenir efficacement à une gestion automatisée des centres de données.

Mots-clés:Contrôle thermique du centre de données d'apprentissage automatique

Avec le développement de la technologie Internet, la demande de puissance de calcul des gens a augmenté et il existe de plus en plus de grands centres de données. Mais un tel développement constitue également une menace pour l’environnement et l’énergie. 

Les centres de données consomment un pourcentage important de l’énergie des systèmes commerciaux et industriels à grande échelle. D'un point de vue environnemental, Les données de 2017 montrent que les centres de données utilisent 3 % de la consommation énergétique mondiale et émettent 2 % des gaz à effet de serre mondiaux.

Un autre rapport indique que les centres de données utilisent environ 200 térawattheures (TWh) d'électricité par an, ce qui équivaut à peu près à la consommation énergétique nationale totale de l'Iran.

Un centre de données Google

Si l’utilisation de l’énergie des centres de données peut être optimisée, même de légères améliorations peuvent réduire considérablement les émissions de gaz à effet de serre et atténuer efficacement les problèmes énergétiques et environnementaux.

Google utilise la technologie de l’IA pour y parvenir. 

Si vous ne vous calmez pas, vous brûlerez de l’argent

Une grande partie de la consommation d’énergie supplémentaire dans les centres de données provient du refroidissement, tout comme la chaleur nécessaire lorsqu’un ordinateur portable fonctionne.

Les centres de données de Google fournissent des serveurs pour des applications populaires telles que Google Search, Gmail et YouTube, qui génèrent également d'énormes quantités de chaleur pendant leur fonctionnement et doivent être dissipées efficacement pour assurer leur fonctionnement normal. 

Système de refroidissement du centre de données

Cependant, les méthodes de refroidissement conventionnelles, telles que les pompes, les refroidisseurs et les tours de refroidissement, sont difficiles à utiliser dans un environnement dynamique comme un centre de données. Les principaux obstacles proviennent des aspects suivants : 

1. Comment les ingénieurs utilisent les équipements et les effets complexes et non linéaires de l’environnement sur les équipements. Les approches traditionnelles et l’intuition humaine ne parviennent souvent pas à saisir ces interactions dans l’environnement complexe d’un centre de données. 

2. Le système ne peut pas s’adapter rapidement aux changements internes ou externes (comme la météo). Cela est dû au fait que les ingénieurs ne peuvent pas développer de règles et d’heuristiques pour tous les scénarios d’exploitation. 

3. Chaque centre de données possède une architecture et un environnement uniques. Un modèle personnalisé pour un système peut ne pas convenir à un autre. Par conséquent, un cadre intelligent général est nécessaire pour comprendre les interactions des centres de données. 

Des centaines de lignes de code permettent d'économiser des centaines de millions de dollars

Pour résoudre les problèmes ci-dessus, Google et DeepMind tentent d’utiliser des méthodes d’apprentissage automatique (ML) pour améliorer l’efficacité énergétique des centres de données de Google. 

En 2016, Google et DeepMind ont lancé un système de recommandation basé sur le ML qui utilisait différents scénarios et paramètres de fonctionnement au sein du centre de données pour former le système de réseau neuronal, créant ainsi un cadre efficace et adaptatif. 

Les données sur lesquelles ils se sont entraînés étaient des enregistrements historiques collectés par des milliers de capteurs dans le centre de données, notamment la température, la puissance, la vitesse de la pompe, les points de consigne et d'autres données. 

Le PUE (Power Usage Effectiveness) est défini comme le rapport entre la consommation énergétique totale du bâtiment et la consommation énergétique informatique. Plus le ratio est proche de 1, plus l’utilisation de l’énergie est efficace. 

L'objectif étant d'améliorer l'efficacité énergétique des centres de données, le réseau neuronal est formé en utilisant le PUE (Power Usage Effectiveness) moyen comme paramètre. 

Plage de mesure du PU du centre de données Google

Séparément, ils ont formé deux ensembles de réseaux neuronaux profonds pour prédire la température et la pression futures dans un centre de données une heure à l'avance. Le but de ces prédictions est de simuler les opérations recommandées dans le modèle PUE pour garantir qu'aucune contrainte d'exploitation ne soit dépassée. 

Testez vos modèles en les déployant en direct sur un centre de données. L'image ci-dessous montre l'un de ces tests, y compris les prédictions sur le moment où l'apprentissage automatique est activé et quand il est désactivé. 

En utilisant l'approche ML, le système a pu réduire de manière constante l'énergie utilisée pour le refroidissement de 40 %, et après avoir éliminé les pertes électriques et autres inefficacités non liées au refroidissement, le coût total de l'énergie consommée a été réduit de 15 %. Cela équivalait à économiser des centaines de millions de dollars en dépenses d’investissement à l’époque. Il a également produit le PUE le plus bas jamais enregistré. 

Données PUE pour tous les centres de données à grande échelle de Google

L'IA basée sur le cloud est sur le point de remplacer le travail humain

En 2018, ils ont porté ce système au niveau supérieur, où l'IA bénéficie de plus d'autonomie et contrôle désormais directement le refroidissement du centre de données, mais reste également sous la supervision professionnelle de l'opérateur du centre de données. Le nouveau système mis à niveau fournit déjà des services d’économie d’énergie à plusieurs centres de données Google. 

Cette technologie fournit des analyses et des politiques sous forme de service basé sur le cloud. 

Toutes les cinq minutes, l’IA basée sur le cloud prend un instantané du système de refroidissement du centre de données à partir de milliers de capteurs et l’alimente dans un réseau neuronal profond, prédisant comment différentes combinaisons d’actions potentielles affecteront la consommation d’énergie future. 

Le système d’IA identifie ensuite quelles opérations entraîneront la moindre consommation d’énergie tout en satisfaisant les contraintes garantissant la sécurité. Ces actions sont ensuite renvoyées au centre de données où elles sont vérifiées puis mises en œuvre par le système de contrôle local. 

Quatre étapes d'une opération spécifique

L’idée est venue des retours des opérateurs de centres de données qui utilisaient des systèmes de recommandation d’IA. Les opérateurs affirment que le système a permis d’apprendre de nouvelles bonnes pratiques, comme la répartition de la charge de refroidissement sur davantage d’équipements avec l’aide et la supervision des opérateurs. Mais je suis curieux de savoir si des économies d’énergie similaires peuvent être réalisées sans mise en œuvre manuelle. 

Puis l’IA a complètement pris le dessus. L’assistance de l’opérateur est pratiquement éliminée.

Dans le nouveau système, ils ont repensé l'agent d'IA et l'infrastructure sous-jacente, tout en se concentrant sur la sécurité et la fiabilité, en utilisant une variété de mécanismes pour garantir que le système fonctionne toujours comme prévu.

Autres modes de contrôle de sécurité

De plus, le contrôle ultime appartient à l’opérateur, et non à l’IA. Le personnel peut choisir de quitter le mode de contrôle de l'IA à tout moment et de limiter les limites d'optimisation du système pour maintenir l'utilisation de l'IA dans une plage sûre et fiable.

Les responsables de Google ont déclaré : « Nous espérons réaliser des économies d'énergie avec moins de main-d'œuvre. Les systèmes automatisés peuvent effectuer des opérations plus détaillées à une fréquence plus élevée tout en évitant les erreurs. » 

L'IA dit : Il n'y a pas de plus fort, seulement des plus forts

Au cours des mois d’essai du nouveau système, ils ont réalisé en moyenne 30 % d’économies d’énergie durables et continuent d’apporter des améliorations. Et ces systèmes s’améliorent au fil du temps et à mesure que davantage de données s’accumulent, comme le montre la figure ci-dessous.

Ce graphique illustre l’évolution de l’IA au fil du temps, le bleu représentant la quantité de données et le vert représentant les changements de performances.

Sur une période de plusieurs mois, les performances du système de contrôle de l’IA sont passées d’une amélioration de 12 % (au lancement initial du contrôle autonome) à une amélioration d’environ 30 %.

À mesure que la technologie mûrit, la portée d’optimisation du système sera également élargie, permettant ainsi de réduire davantage la consommation d’énergie. 

Les responsables de Google affirment que les centres de données ne sont qu’un début. À long terme, cette technologie a le potentiel d’être appliquée à d’autres secteurs industriels et de contribuer à améliorer les problèmes environnementaux à plus grande échelle.

Cliquez pour lire l'article original