Google تُظهر تقدماً كبيراً في تبريد السيرفرات السائلة في مؤتمر Hot Chips 2025
في مؤتمر هوت شيبس 2025، كشفت جوجل عن تطورات كبيرة في حلول التبريد السائل لمحطات البيانات، خاصةً لوحدات معالجات TPU المصممة لدعم الذكاء الاصطناعي. مع ارتفاع استهلاك الطاقة ودرجة الحرارة الناتجة عن الشريحة الحديثة، أصبح التبريد السائل خيارًا لا مفر منه. تُظهر جوجل أن الماء يمتلك موصلية حرارية تفوق الهواء بأكثر من 4000 مرة، مما يجعله مثاليًا لمواجهة التحديات الحرارية الناتجة عن التوسع الهائل في تطبيقات التعلم الآلي. بدأت جوجل تجربة التبريد السائل لوحدات TPU في 2018، وطورت منذ ذلك الحين تصميمات متكاملة على مستوى المراكز الحاسوبية. تُستخدم حلقات تبريد سائلة تمتد عبر الأرفف، بدلًا من الاعتماد على تبريد داخلي داخل الخوادم. كل رف يحتوي على ستة وحدات توزيع سائل تبريد (CDU)، تعمل كمزيج من المضخة والرادييتور في الأنظمة المنزلية. تُستخدم خراطيم مرنة ووصلات فورية لتسهيل الصيانة وتقليل متطلبات الدقة في التركيب. وبما أن خمسة وحدات كافية لتوفير التبريد الكافي، يمكن إجراء الصيانة على واحدة دون تعطيل الخدمة. تُنقل الحرارة بين السائل المبرد وسائل التبريد في المنشأة عبر وحدات CDU دون خلط الماءين. ثم يُوزع السائل المبرد عبر منافذ توزيع إلى وحدات TPU، حيث يتم توصيل الشريحة بسلسلة داخل الحلقة، مما يعني أن الشريحة الأخيرة تتلقى سائلًا أحرّ. لذلك، يتم حساب قدرة التبريد بناءً على احتياجات الشريحة الأخيرة في كل حلقة. لتحسين الأداء، اعتمدت جوجل صفيحة تبريد من نوع "مُقسّم التدفق" (split-flow)، والتي أثبتت فعالية أفضل من التصميم التقليدي. كما انتقلت TPUv4 إلى تصميم "بدون غطاء" (bare-die)، مشابه لعملية "إزالة الغطاء" (delidding) في أنظمة الـPC الاحترافية، بهدف تحسين نقل الحرارة، نظرًا لارتفاع استهلاك الطاقة بنسبة 60% مقارنة بـTPUv3. بجانب كفاءة نقل الحرارة، يقلل التبريد السائل من استهلاك الطاقة المرتبطة بالتهوية. أظهرت جوجل أن استهلاك مضخات التبريد السائل أقل من 5% من استهلاك المراوح في الأنظمة الهوائية، وهو فائدة كبيرة في مراكز البيانات التي تستخدم مراوحًا عالية السرعة. في المقابل، لا تستفيد الأنظمة المنزلية من هذه الميزة بسبب حجم الطاقة المنخفض نسبيًا. الصيانة تبقى تحديًا رئيسيًا. تواجه جوجل مشكلات مشابهة لمحبي الـPC مثل تسرب السوائل ونمو الكائنات الدقيقة، لكنها تتعامل معها بطرق منظمة. تستخدم اختبارات تسرب دقيقة، أنظمة إنذار مبكرة، صيانة دورية، وتنقية السائل. كما وضعت بروتوكولات واضحة للتعامل مع الأعطال، مما يسمح لفريق كبير بالاستجابة بفعالية ودون توقف خدمة. في نفس اليوم، ظهرت حلول تبريد سائلة في معارض عدة، منها خوادم Nvidia GB300 ذات موصلات خارجية للبرودة، ونظام تبريد من شركة Rebellions AI الكورية الجنوبية التي عرضت معالجها "REBEL Quad" مع كتلة تبريد ووصلة مباشرة إلى مبرد مركزي. كل هذه الإشارات تؤكد أن التبريد السائل لم يعد خيارًا تجريبيًا، بل أصبح ضرورة حتمية في عصر الذكاء الاصطناعي المتصاعد.