هل من الصعب تبديد الحرارة في مراكز البيانات؟ شاهد كيف تستخدم جوجل وديب مايند الذكاء الاصطناعي لحل المشكلة

بقلم سوبر نيرو
وصف السيناريو:تعاونت شركتا Google وDeepMind لاستخدام أساليب التعلم الآلي لتحسين استهلاك الطاقة في مراكز البيانات وتحقيق الإدارة الآلية لمراكز البيانات بشكل فعال.
الكلمات المفتاحية:التحكم الحراري في مركز بيانات التعلم الآلي
مع تطور تكنولوجيا الإنترنت، زاد طلب الناس على قوة الحوسبة، وأصبح هناك المزيد والمزيد من مراكز البيانات الكبيرة. لكن مثل هذا التطور يشكل أيضًا تهديدًا للبيئة والطاقة.
تستهلك مراكز البيانات نسبة كبيرة من الطاقة في الأنظمة التجارية والصناعية واسعة النطاق. من منظور بيئي، تشير بيانات عام 2017 إلى أن مراكز البيانات تستخدم 3% من استخدام الطاقة العالمي وتنبعث منها 2% من الغازات المسببة للاحتباس الحراري العالمي.
وذكر تقرير آخر أن مراكز البيانات تستخدم ما يقدر بنحو 200 تيراواط ساعة من الكهرباء سنويا، وهو ما يعادل تقريبا إجمالي الاستهلاك الوطني للطاقة في إيران.

مركز بيانات جوجل
إذا كان من الممكن تحسين استخدام الطاقة في مراكز البيانات، فإن التحسينات الطفيفة يمكن أن تقلل إلى حد كبير من انبعاثات الغازات المسببة للاحتباس الحراري وتخفف بشكل فعال مشاكل الطاقة والبيئة.
وقد استخدمت جوجل تقنية الذكاء الاصطناعي للقيام بذلك.
إذا لم تهدأ، ستحرق المال
يأتي جزء كبير من استهلاك الطاقة الإضافية في مراكز البيانات من التبريد، تمامًا مثل الحرارة اللازمة لتشغيل الكمبيوتر المحمول.
توفر مراكز بيانات Google خوادم للتطبيقات الشائعة مثل Google Search وGmail وYouTube، والتي تولد أيضًا كميات هائلة من الحرارة أثناء التشغيل ويجب تبديدها بشكل فعال لضمان تشغيلها بشكل طبيعي.

نظام تبريد مركز البيانات
ومع ذلك، من الصعب استخدام طرق التبريد التقليدية، مثل المضخات والمبردات وأبراج التبريد، في بيئة ديناميكية مثل مركز البيانات. وتأتي العقبات الرئيسية من الجوانب التالية:
1. كيف يقوم المهندسون بتشغيل المعدات والتأثيرات المعقدة وغير الخطية للبيئة على المعدات. غالبًا ما تفشل الأساليب التقليدية والحدس البشري في التقاط هذه التفاعلات في البيئة المعقدة لمركز البيانات.
2. لا يستطيع النظام التكيف بسرعة مع التغيرات الداخلية أو الخارجية (مثل الطقس). ويرجع ذلك إلى أن المهندسين غير قادرين على تطوير القواعد والأساليب لجميع سيناريوهات التشغيل.
3. يتمتع كل مركز بيانات بهندسة وبيئة فريدة. قد لا يكون النموذج المخصص لنظام واحد مناسبًا لنظام آخر. ومن ثم، هناك حاجة إلى إطار عمل ذكي عام لفهم تفاعلات مراكز البيانات.
مئات من أسطر التعليمات البرمجية توفر مئات الملايين من الدولارات
ولحل المشكلات المذكورة أعلاه، تحاول Google وDeepMind استخدام أساليب التعلم الآلي (ML) لتحسين كفاءة الطاقة في مراكز بيانات Google.
في عام 2016، أطلقت Google وDeepMind نظام توصية يعتمد على التعلم الآلي والذي استخدم سيناريوهات تشغيل ومعلمات مختلفة داخل مركز البيانات لتدريب نظام الشبكة العصبية، مما أدى إلى إنشاء إطار عمل فعال وقابل للتكيف.
كانت البيانات التي تدربوا عليها عبارة عن سجلات تاريخية تم جمعها بواسطة آلاف أجهزة الاستشعار في مركز البيانات، بما في ذلك درجة الحرارة، والطاقة، وسرعة المضخة، ونقاط الضبط، وغيرها من البيانات.
يتم تعريف PUE (فعالية استخدام الطاقة) على أنها نسبة إجمالي استهلاك الطاقة في المبنى إلى استهلاك الطاقة في تكنولوجيا المعلومات. كلما اقتربت النسبة من 1، كلما كان استخدام الطاقة أكثر كفاءة.
نظرًا لأن الهدف هو تحسين كفاءة الطاقة في مراكز البيانات، يتم تدريب الشبكة العصبية باستخدام متوسط PUE (فعالية استخدام الطاقة) كمعلمة.

نطاق قياس وحدة المعالجة المركزية لمركز بيانات Google
وبشكل منفصل، قاموا بتدريب مجموعتين من الشبكات العصبية العميقة للتنبؤ بدرجة الحرارة والضغط في مركز البيانات في المستقبل بعد ساعة واحدة. الغرض من هذه التوقعات هو محاكاة العمليات الموصى بها في نموذج PUE للتأكد من عدم تجاوز أي قيود تشغيلية.
اختبر نماذجك عن طريق نشرها مباشرة على مركز البيانات. تُظهر الصورة أدناه أحد هذه الاختبارات، بما في ذلك التنبؤات حول متى يتم تشغيل التعلم الآلي ومتى يتم إيقاف تشغيله.

وباستخدام نهج التعلم الآلي، تمكن النظام من تقليل الطاقة المستخدمة للتبريد بشكل ثابت بنسبة 40%، وبعد القضاء على الخسائر الكهربائية وغيرها من أوجه عدم الكفاءة غير المتعلقة بالتبريد، تم تقليل إجمالي تكلفة استخدام الطاقة بنسبة 15%. وكان هذا يعادل توفير مئات الملايين من الدولارات من النفقات الرأسمالية في ذلك الوقت. كما أنتجت أيضًا أدنى مستوى PUE على الإطلاق.

بيانات PUE لجميع مراكز البيانات واسعة النطاق التابعة لشركة Google
الذكاء الاصطناعي المستند إلى السحابة على وشك أن يحل محل العمل البشري
في عام 2018، أخذوا هذا النظام إلى المستوى التالي، حيث تم منح الذكاء الاصطناعي المزيد من الاستقلالية ويتحكم الآن بشكل مباشر في تبريد مركز البيانات، ولكنه يظل أيضًا تحت الإشراف المهني لمشغل مركز البيانات. يوفر النظام الجديد المحدث بالفعل خدمات توفير الطاقة لمراكز بيانات Google المتعددة.
توفر هذه التقنية التحليلات والسياسات كخدمة تعتمد على السحابة.
كل خمس دقائق، تقوم الذكاء الاصطناعي المستند إلى السحابة بأخذ لقطة من نظام التبريد الخاص بمركز البيانات من آلاف أجهزة الاستشعار وتغذيتها إلى شبكة عصبية عميقة، والتنبؤ بكيفية تأثير مجموعات مختلفة من الإجراءات المحتملة على استهلاك الطاقة في المستقبل.
ويقوم نظام الذكاء الاصطناعي بعد ذلك بتحديد العمليات التي ستؤدي إلى أقل استهلاك للطاقة مع تلبية القيود التي تضمن السلامة. يتم بعد ذلك إرسال هذه الإجراءات مرة أخرى إلى مركز البيانات حيث يتم التحقق منها وتنفيذها بواسطة نظام التحكم المحلي.




أربع خطوات للعملية المحددة
جاءت الفكرة من ردود الفعل التي تلقيناها من مشغلي مراكز البيانات الذين استخدموا أنظمة التوصية بالذكاء الاصطناعي. ويقول المشغلون إن النظام علمهم بعض أفضل الممارسات الجديدة، مثل توزيع حمل التبريد على المزيد من المعدات بمساعدة وإشراف المشغلين. لكن من الغريب أن نتمكن من تحقيق توفير مماثل للطاقة دون الحاجة إلى التنفيذ اليدوي.
ثم سيطر الذكاء الاصطناعي بشكل كامل. يتم القضاء على مساعدة المشغل تقريبًا.
في النظام الجديد، قاموا بإعادة تصميم وكيل الذكاء الاصطناعي والبنية الأساسية الأساسية، مع التركيز أيضًا على الأمان والموثوقية، باستخدام مجموعة متنوعة من الآليات لضمان تشغيل النظام دائمًا كما هو متوقع.

أوضاع التحكم الأمني الأخرى
علاوة على ذلك، فإن التحكم النهائي يقع على عاتق المشغل، وليس الذكاء الاصطناعي. يمكن للموظفين اختيار الخروج من وضع التحكم بالذكاء الاصطناعي في أي وقت وتقييد حدود تحسين النظام للحفاظ على استخدام الذكاء الاصطناعي ضمن نطاق آمن وموثوق.
صرح مسؤولو جوجل: "نأمل في تحقيق ترشيد استهلاك الطاقة باستخدام عدد أقل من القوى العاملة. تستطيع الأنظمة الآلية إجراء عمليات أكثر تفصيلاً بتردد أعلى مع تجنب الأخطاء".
تقول الذكاء الاصطناعي: لا يوجد أقوى، بل يوجد أقوى فقط
خلال أشهر تجربة النظام الجديد، تمكنوا من تحقيق متوسط توفير مستدام للطاقة بنسبة 30%، وما زالوا يقومون بإجراء التحسينات. وتتحسن هذه الأنظمة بمرور الوقت ومع تراكم المزيد من البيانات، كما هو موضح في الشكل أدناه.

يوضح هذا الرسم البياني كيف تغيرت الذكاء الاصطناعي بمرور الوقت، حيث يمثل اللون الأزرق كمية البيانات ويمثل اللون الأخضر التغييرات في الأداء.
على مدى عدة أشهر، ارتفع أداء نظام التحكم بالذكاء الاصطناعي من تحسن بنسبة 12% (عند الإطلاق الأولي للتحكم الذاتي) إلى تحسن بنسبة 30% تقريبًا.
ومع نضوج التكنولوجيا، سيتم أيضًا توسيع نطاق تحسين النظام، وبالتالي تحقيق تخفيضات أكبر في استهلاك الطاقة.
ويقول مسؤولون في جوجل إن مراكز البيانات هي مجرد البداية. وعلى المدى الطويل، تتمتع هذه التكنولوجيا بالقدرة على تطبيقها في قطاعات صناعية أخرى، وتساعد في تحسين القضايا البيئية على نطاق أوسع.