شرائح مدمجة على مستوى القرص قد تعكس هندسة الذكاء الاصطناعي وتزيد من كفاءتها البيئية
تقنية الشرائح المتكاملة على المستوى الفرعي قد تعيد تعريف الذكاء الاصطناعي كشف فريق من المهندسين في جامعة كاليفورنيا ريفرسايد (UCR) في مراجعة تقنية نُشرت في مجلة Device عن إمكانات شريحة جديدة يمكن أن تعيد رسم مستقبل الذكاء الاصطناعي وتكون أكثر صداقة للبيئة. تُعرف هذه الشرائح الضخمة باسم "المُسرِّعات على مستوى الفرعي" (wafer-scale accelerators)، وهي مصنوعة من أقراص السيليكون التي تبلغ حجمها حجم طبق العشاء، مما يشكل تباينًا واضحًا مع الوحدات التقليدية للمعالجة الرسومية (GPUs) التي لا تتجاوز حجم طوابع البريد. المميزات الفنية وفقًا لتحليل الفريق المتخصص في UCR، يمكن أن تقدم المُسرِّعات على مستوى الفرعي قوة حوسبة أكبر بكثير بكفاءة طاقية أعلى. هذا يعتبر ضروريًا مع زيادة حجم وتعقيد نماذج الذكاء الاصطناعي. قال البروفيسور ميهري أوزكان، أستاذ الهندسة الكهربائية وهندسة الحاسوب في كلية بورنز للهندسة في UCR، وهو المؤلف الرئيسي للورقة: "تمثل تقنية المستوى الفرعي قفزة كبيرة للأمام. إنها تمكن نماذج الذكاء الاصطناعي ذات المعلمات التريليونية من العمل بشكل أسرع وأكثر كفاءة من الأنظمة التقليدية". مقارنة مع التقنيات التقليدية الوحدات التقليدية للمعالجة الرسومية (GPUs) أصبحت أدوات أساسية في تطوير الذكاء الاصطناعي بسبب قدرتها على أداء حسابات كثيرة في وقت واحد، وهو ما يناسب معالجة الصور واللغات والتدفقات البيانات بشكل متوازي. ومع ذلك، مع زيادة تعقيد نماذج الذكاء الاصطناعي، بدأت حتى الوحدات عالية الأداء في مواجهة حدود الأداء والاستهلاك الطاقي. تُبرز الورقة تقنيات مثل نظام "شريحة على فرعي على قاعدة" (chip-on-wafer-on-substrate packaging)، الذي يمكن أن يجعل تصاميم المستوى الفرعي أكثر تركيزًا وبساطة، مع زيادة محتملة تبلغ 40 مرة في كثافة الحوسبة. تهدف هذه الأنظمة إلى القضاء على الزجاجات التي تحدث عند الحاجة إلى نقل البيانات بين الشرائح الصغيرة المتعددة. أمثلة على المُسرِّعات على مستوى الفرعي تشمل الأمثلة على هذه الأنظمة شريحة Cerebras Wafer-Scale Engine 3 (WSE-3)، التي تحتوي على 4 تريليونات موصل وكernels محددة للاستخدامات الذكية الاصطناعية تبلغ 900,000 على قرص واحد. كما يوجد شريحة Tesla's Dojo D1، التي تحتوي على 1.25 تريليونات موصل وحوالي 9,000 kernel لكل وحدة. تُصمم هذه الأنظمة لتجنب التأخيرات وخسارة الطاقة التي تنتج عن التواصل بين الشرائح الأصغر. قال أوزكان: "بالحفاظ على كل شيء على قرص واحد، نتجنب التأخيرات وخسارة الطاقة التي تنتج عن التواصل بين الشرائح". بالإضافة إلى ذلك، يمكن لشريحة Cerebras WSE-3 أداء ما يصل إلى 125 كواردريون عملية في الثانية باستخدام جزء بسيط من الطاقة اللازمة لنظم GPU المماثلة. تُحافظ هندستها على البيانات محليًا، مما يقلل من استهلاك الطاقة والانبعاثات الحرارية. الاستدامة البيئية أحد المخاوف الرئيسية في مجال الذكاء الاصطناعي هو الاستدامة. تستخدم مراكز البيانات التي تعمل بالوحدات التقليدية للمعالجة الرسومية (GPUs) كميات هائلة من الطاقة والمياه للحفاظ على برودتها. في المقابل، تُساهم المُسرِّعات على مستوى الفرعي في تقليل حركة البيانات الداخلية، مما يعني استهلاك أقل للطاقة في كل مهمة. على سبيل المثال، تُظهر تقارير Cerebras أن حمولات الاستدلال على نظام WSE-3 تستهلك سدس الطاقة المستهلكة في التجهيزات السحابية المُعتمدة على GPU. يتم استخدام هذه التقنية بالفعل في محاكاة المناخ، الهندسة المستدامة، ونمذجة التقاط الكربون. قال أوزكان: "نرى أن أنظمة المستوى الفرعي تسريع البحث في الاستدامة نفسها. هذا انتصار للحوسبة وللكوكب أيضًا". تحديات التبريد ومع ذلك، تظل الحرارة تمثل تحديًا. حيث تصل قوة التصميم الحراري لشرائح المستوى الفرعي إلى 10,000 واط، مما يتطلب تبريدًا متقدمًا. تعتمد Cerebras على حلقة Glycol مدمجة في عبوة الشريحة، بينما تستخدم Tesla نظام تبريد يوزع السائل بشكل متساوٍ عبر سطح الشريحة. التأثير البيئي لتصنيع الشرائح يؤكد المؤلفون أن ما يصل إلى 86% من البصمة الكربونية الإجمالية للنظام يمكن أن تكون ناتجة عن عمليات التصنيع وسلاسل الإمداد، وليس فقط الاستهلاك الطاقي. يُشجعون على استخدام مواد قابلة لإعادة التدوير وسبائك ذات انبعاثات منخفضة، بالإضافة إلى ممارسات تصميم دورة حياة كاملة. قال أوزكان: "تبدأ الكفاءة من المصنع. للحد الحقيقي من تأثير الحوسبة، يجب علينا إعادة النظر في العملية بأكملها، من الفرعي إلى النفايات". الخلاصة والتوصيات رغم المزايا الكبيرة للمُسرِّعات على مستوى الفرعي، فإنها ليست مناسبة لكل التطبيقات. فهي غالية التصنيع وأقل مرونة في المهام الصغيرة. تبقى الوحدات التقليدية للمعالجة الرسومية (GPUs) مهمة في العديد من الإعدادات بفضل مودوليتها واقتصاديتها. يأمل الفريق أن تُقدم هذه المراجعة خريطة طريق للمحققين والمهندسين وصانعي السياسات الذين يتنقلون في مستقبل أجهزة الذكاء الاصطناعي. قال أوزكان: "هذه المراجعة هي نتيجة تعاون تخصصي عميق. نأمل أن تخدم كدليل للمهتمين في هذا المجال". تقييم الخبراء يرى الخبراء أن تقنية المُسرِّعات على مستوى الفرعي تمثل ثورة في مجال الحوسبة السحابية والذكاء الاصطناعي. بينما تمتلك التقنيات التقليدية مزاياها، فإن الابتكارات الجديدة في تقنية الشرائح الفرعية تُقدم حلولًا أكثر كفاءة واستدامة. تعتبر هذه التقنية خطوة مهمة نحو تحقيق أهداف الاستدامة البيئية في مجال التكنولوجيا. نبذة عن شركة Cerebras تأسست شركة Cerebras Systems في عام 2016، وتُركز على تطوير تقنيات الحوسبة الفائقة لخدمة الذكاء الاصطناعي. تعتبر شريحة Wafer-Scale Engine 3 (WSE-3) من أهم منتجاتها، وهي تُستخدم في مجموعة متنوعة من التطبيقات، بما في ذلك محاكاة المناخ ونموذج التقاط الكربون. تطمح الشركة إلى تغيير طريقة عمل مراكز البيانات وتقليل تأثيرها البيئي من خلال تقنياتها المبتكرة.