HyperAI

جوجل تكشف عن سلاحها السري TPU، AlphaChip في مجلة Nature! تحليل متعمق لتاريخ تطوير شرائح تصميم الذكاء الاصطناعي

特色图像

في عام 2020، نشرت شركة جوجل ورقة بحثية أولية بارزة بعنوان "وضع الشريحة باستخدام التعلم التعزيزي العميق"، حيث أظهرت للعالم لأول مرة تخطيط الشريحة الذي تم تصميمه باستخدام طريقة التعلم التعزيزي الجديدة.مكّن هذا الابتكار جوجل من إدخال الذكاء الاصطناعي في تصميم شريحة TPU، مما أدى إلى تحقيق تصميم شريحة يتفوق على المصممين البشريين.

بحلول عام 2022، قامت جوجل بفتح مصدر كود الخوارزمية الموصوف في الورقة البحثية، مما يسمح للباحثين في جميع أنحاء العالم باستخدام هذا المورد لتدريب كتل الشريحة مسبقًا.

اليوم، تم اختبار طريقة التعلم المعتمدة على الذكاء الاصطناعي هذه على أجيال متعددة من المنتجات، بما في ذلك TPU v5e، وTPU v5p، وTrillium، وحققت نتائج ملحوظة داخل Google. والأمر الأكثر إثارة للدهشة هو أن فريق Google DeepMind نشر مؤخرًا ملحقًا لهذه الطريقة في مجلة Nature، والذي شرح بمزيد من التفصيل تأثيرها البعيد المدى على مجال تصميم الرقائق. في نفس الوقت،كما افتتحت Google أيضًا نقطة تفتيش مدربة مسبقًا تعتمد على 20 وحدة TPU، وشاركت أوزان النموذج، وأطلقت عليها اسم AlphaChip.

إن ظهور AlphaChip لا يشير فقط إلى أن تطبيق الذكاء الاصطناعي في تصميم الرقائق سيصبح أكثر شمولاً، بل يشير أيضًا إلى أننا نتحرك نحو عصر جديد من "تصميم الرقائق".

AlphaChip: كيف يستخدم Google DeepMind الذكاء الاصطناعي لإحداث ثورة في تصميم الرقائق

باعتبارها قمة Google DeepMind، تجذب AlphaChip انتباه مجتمع التكنولوجيا العالمي بتقدمها الثوري في تصميم الشريحة.

يعد تصميم الرقائق مجالًا في قمة التكنولوجيا الحديثة. تكمن تعقيداتها في ربط عدد لا يحصى من المكونات الدقيقة بذكاء من خلال أسلاك دقيقة للغاية. باعتبارها واحدة من أولى تقنيات التعلم التعزيزي المستخدمة لحل مشاكل الهندسة في العالم الحقيقي، يمكن لـ AlphaChip إكمال تصميمات تخطيط الشريحة المماثلة أو الأفضل من البشر في بضع ساعات فقط، دون الحاجة إلى أسابيع أو أشهر من العمل البشري. لقد فتح هذا التقدم الرائد الباب أمام خيالنا ليتجاوز الحدود التقليدية.

فكيف بالضبط يتمكن AlphaChip من تحقيق هذا الإنجاز؟
يكمن سر AlphaChip في مبدأ التعلم التعزيزي الذي يعتمده، والذي يعامل تصميم تخطيط الشريحة وكأنه لعبة. بدءًا من شبكة فارغة، يقوم AlphaChip بوضع كل مكون من مكونات الدائرة تدريجيًا حتى يتم وضع كل شيء في مكانه. وبعد ذلك، سيقوم النظام بمنح مكافآت مناسبة بناءً على جودة التصميم.


الأمر الأكثر أهمية هو أن جوجل اقترحت بشكل مبتكر شبكة عصبية بيانية "تعتمد على الحافة".يتيح هذا لـ AlphaChip تعلم العلاقات بين مكونات الشريحة وتطبيقها على تصميم الشريحة بأكملها، وبالتالي تحقيق التجاوز الذاتي في كل تصميم. على غرار AlphaGo، يمكن لـ AlphaChip التعلم من خلال "الألعاب" لإتقان فن تصميم تخطيطات الشريحة الممتازة.

في العملية المحددة لتصميم تخطيط TPU، سوف تقوم AlphaChip أولاً بالتدريب المسبق على وحدات مختلفة من الأجيال السابقة من الرقائق، بما في ذلك وحدات الشبكة الموجودة على الشريحة وبين الشرائح، ووحدات التحكم في الذاكرة، ومخازن نقل البيانات. توفر مرحلة ما قبل التدريب هذه لـ AlphaChip تجربة غنية. بعد ذلك، استخدمت Google AlphaChip لإنشاء تخطيطات عالية الجودة لوحدات TPU الحالية.

على عكس الطرق التقليدية، يعمل AlphaChip على تحسين نفسه بشكل مستمر من خلال حل المزيد من مهام تخطيط الشريحة، تمامًا كما يعمل الخبراء البشريون على تحسين مهاراتهم من خلال الممارسة. كما قال ديميس هاسابيس، المؤسس المشارك والرئيس التنفيذي لشركة DeepMind:لقد قامت Google ببناء حلقة تغذية راجعة قوية حول AlphaChip:

* أولاً، قم بتدريب نموذج تصميم الشريحة المتقدم (AlphaChip)

* ثانيًا، استخدم AlphaChip لتصميم شرائح الذكاء الاصطناعي الأفضل

* ثم استخدم شرائح الذكاء الاصطناعي هذه لتدريب نماذج أفضل

*وأخيرًا، استخدم هذه النماذج لتصميم شرائح أفضل


تتيح هذه العملية المتكررة ترقية النماذج وشرائح الذكاء الاصطناعي في وقت واحد. قال ديميس هاسابيس، "هذا هو جزء من السبب وراء الأداء الجيد لمجموعة TPU الخاصة بشركة Google."


وبالمقارنة بالخبراء البشريين، فإن AlphaChip لا يضع عددًا أكبر من الوحدات فحسب، بل يقلل أيضًا من طول الأسلاك بشكل كبير.مع كل جيل جديد من TPU، تقوم AlphaChip بتصميم تخطيط أفضل للشريحة، مما يوفر مخططًا أرضيًا شاملاً أكثر اكتمالاً، وبالتالي تقصير دورة التصميم وتحسين أداء الشريحة.

عدد شرائح تصميم AlphaChip من Google ومتوسط انخفاض طول الخط في ثلاثة أجيال من TPU (v5e، TPU v5p)

رحلة Google TPU الممتدة لعشر سنوات: من استمرار ASIC إلى ابتكار تصميم الذكاء الاصطناعي

باعتبارها شركة رائدة ومستكشفة في مجال TPU، فإن تاريخ تطوير Google في خط التكنولوجيا هذا لا يعتمد فقط على رؤيتها الثاقبة، بل يوضح أيضًا شجاعتها غير العادية.
كما نعلم جميعًا، في الثمانينيات،تتميز ASIC (الدائرة المتكاملة المخصصة للتطبيق) بفعاليتها العالية من حيث التكلفة وقوة المعالجة القوية والسرعة العالية.وقد حظيت بتأييد واسع في السوق. ومع ذلك، يتم تحديد وظيفة ASIC بواسطة أدوات قناع مخصصة، مما يعني أن العملاء بحاجة إلى دفع رسوم هندسية غير متكررة (NRE) مقدمًا باهظة الثمن.

في هذا الوقت،تتمتع تقنية FPGA (مصفوفة البوابات القابلة للبرمجة ميدانيًا) بمزايا خفض التكاليف الأولية وتقليل مخاطر تخصيص المنطق الرقمي.لقد أصبح محط أنظار الجمهور، وعلى الرغم من أنه لا يتفوق على جميع الموديلات الأخرى من حيث الأداء، إلا أنه فريد من نوعه في السوق.

في ذلك الوقت، توقعت الصناعة عمومًا أن قانون مور سوف يدفع أداء FPGA إلى ما هو أبعد من احتياجات ASICs. ولكن اتضح أن FPGA، باعتبارها "شريحة عالمية" قابلة للبرمجة، تعمل بشكل جيد في المنتجات الاستكشافية والدفعات الصغيرة ويمكنها تحقيق سرعة أفضل أو استهلاك طاقة أو مؤشرات تكلفة أفضل من وحدات معالجة الرسومات، ولكنها لا تزال غير قادرة على الهروب من القاعدة التي تنص على أنه "لا يمكن تحقيق العالمية والمثالية في نفس الوقت". بمجرد أن مهدت FPGAs الطريق أمام بنية متخصصة، فقد أفسحت المجال لـ ASICs أكثر تخصصًا.

منذ القرن الحادي والعشرين، أصبح جنون تكنولوجيا الذكاء الاصطناعي ينمو بقوة أكبر وأقوى. استمرت خوارزميات التعلم الآلي والتعلم العميق في التكرار. لقد زاد الطلب في الصناعة على شرائح الحوسبة المخصصة للذكاء الاصطناعي عالية الأداء ومنخفضة الطاقة، ويبدو أن وحدات المعالجة المركزية ووحدات معالجة الرسومات وما إلى ذلك غير قادرة على التعامل مع العديد من المهام المعقدة. وعلى هذه الخلفية، اتخذت جوجل قرارا جريئا في عام 2013.تم اختيار ASICs لبناء البنية التحتية لـ TPU وتطويرها حول TensorFlow وJAX.

ومن الجدير بالذكر أن البحث والتطوير المستقل لـ ASIC هو عملية ذات دورة طويلة واستثمار كبير وعتبة عالية ومخاطر كبيرة. بمجرد اختيار الاتجاه الخاطئ، فإنه قد يؤدي إلى خسائر اقتصادية ضخمة. ومع ذلك، من أجل استكشاف حلول التعلم الآلي الأكثر فعالية من حيث التكلفة وكفاءة الطاقة، بدأت جوجل في تطوير TPUv1 في عام 2013 مباشرة بعد تحقيق اختراق في التعرف على الصور من خلال التعلم العميق في عام 2012، وأعلنت عن الإطلاق الداخلي للجيل الأول من شرائح TPU (TPU v1) في عام 2015.ويمثل هذا ميلاد أول مسرع في العالم مصمم خصيصًا للذكاء الاصطناعي.

ولحسن الحظ، حظيت TPU قريبًا بفرصة رائعة للتظاهر - ففي مارس 2016، نجح AlphaGo Lee في هزيمة بطل العالم في Go Lee Sedol. باعتباره الإصدار من الجيل الثاني لسلسلة AlphaGo، فهو يعمل على Google Cloud ويستهلك 50 وحدة معالجة مركزية للحسابات.

ومع ذلك، لم يحقق TPU فورًا تطبيقات ناجحة على نطاق واسع في الصناعة. لم تدخل مادة TPU مرحلة جديدة من التطوير حقًا إلا بعد اقتراح طريقة تخطيط شريحة AlphaChip.

تاريخ تطوير Google TPU

في عام 2020، استعرضت Google قدرات AlphaChip في ورقة بحثية أولية بعنوان "وضع الشريحة باستخدام التعلم التعزيزي العميق".إنه قادر على التعلم من الخبرات السابقة والتحسين المستمر من خلال تصميم بنية عصبية يمكنها التنبؤ بدقة بالمكافآت على مجموعة متنوعة من قوائم الشبكة وتخطيطاتها، مما يؤدي إلى توليد تضمينات ميزات غنية لقائمة الشبكة المدخلة.

تنظر AlphaChip إلى شروط تحسين الأداء باعتبارها شروط الفوز في اللعبة، وتتبنى أسلوب التعلم التعزيزي لتحسين قدرات تخطيط الشريحة بشكل مستمر من خلال تدريب وكيل ذكي بهدف تعظيم المكافآت التراكمية. لقد أطلقوا 10000 لعبة، مما يسمح للذكاء الاصطناعي بممارسة التخطيط والتوجيه على 10000 شريحة وجمع البيانات، مع التعلم والتحسين المستمر.

وفي النهاية، وجد الباحثون أن أداء الذكاء الاصطناعي كان أفضل أو مماثلاً للتخطيط اليدوي من حيث المساحة والطاقة وطول السلك مقارنة بالمهندسين البشريين، مع تلبية معايير التصميم في وقت أقل بكثير. وتظهر النتائج أنيمكن لبرنامج AlphaChip إنشاء تخطيطات على قوائم شبكات المسرعات الحديثة التي تنافس الأداء اليدوي أو تتجاوزه في أقل من 6 ساعات.وفي ظل نفس الظروف، قد يحتاج الخبراء البشريون الحاليون إلى عدة أسابيع لإكمال نفس المهمة.

بمساعدة AlphaChip، يتزايد اعتماد Google على TPU. ديسمبر 2023أطلقت شركة جوجل ثلاثة إصدارات مختلفة من النموذج العام الكبير متعدد الوسائط Gemini، والذي يستخدم على نطاق واسع شرائح Cloud TPU v5p للتدريب. مايو 2024أطلقت شركة جوجل شريحة TPU من الجيل السادس Trillium، والتي يمكن توسيعها إلى مجموعة تصل إلى 256 وحدة TPU في وحدة واحدة عالية النطاق الترددي ومنخفضة الكمون. بالمقارنة مع الأجيال السابقة، يعد Trillium أكثر قوة في تكييف التدريب النموذجي.

وفي الوقت نفسه، تجاوزت شرائح TPU تدريجياً شركة Google واكتسبت اعترافاً أوسع في السوق. 30 يوليو 2024في ورقة بحثية أصدرتها شركة Apple، ادعت الشركة أنها اختارت نوعين من مجموعات السحابة Tensor Processing Unit (TPU) من Google عند تدريب نموذج الذكاء الاصطناعي AFM في نظام Apple Intelligence البيئي. وتُظهر بيانات أخرى أن أكثر من 60% من الشركات الناشئة في مجال الذكاء الاصطناعي التوليدي ونحو 90% من شركات الذكاء الاصطناعي التوليدي العملاقة تستخدم البنية الأساسية للذكاء الاصطناعي وخدمات Cloud TPU من Google Cloud.

تشير كل الدلائل إلى أنه بعد عقد من العمل الجاد، خرجت TPU من فترة الحضانة وبدأت في المساهمة في عصر الذكاء الاصطناعي لشركة Google بأدائها الممتاز في الأجهزة.كما أن مسار "تصميم شريحة الذكاء الاصطناعي" الموجود في AlphaChip فتح آفاقًا جديدة في مجال تصميم الشريحة.

الذكاء الاصطناعي يُحدث ثورة في تصميم الرقائق: من Google AlphaChip إلى استكشاف أتمتة العمليات الكاملة

رغم أن AlphaChip تعتبر فريدة من نوعها في مجال الرقائق المصممة بالذكاء الاصطناعي، إلا أنها ليست الوحيدة. لقد تم توسيع نطاق مجسات تقنية الذكاء الاصطناعي على نطاق واسع لتشمل العديد من الروابط الرئيسية مثل التحقق من الشريحة واختبارها.

المهمة الأساسية لتصميم الشريحة هي تحسين استهلاك الشريحة للطاقة (الطاقة) والأداء (الأداء) والمساحة (المساحة). يشار إلى هذه المؤشرات الثلاثة الرئيسية بشكل جماعي باسم PPA. يُطلق على هذا التحدي أيضًا اسم استكشاف مساحة التصميم. تقليديا، يتم إكمال هذه المهمة بواسطة أدوات EDA، ولكن من أجل تحقيق الأداء الأمثل، يجب على مهندسي الرقائق إجراء تعديلات يدوية باستمرار ثم تسليمها إلى أدوات EDA للتحسين مرة أخرى، وتكرار هذه الدورة. إن هذه العملية تشبه وضع الأثاث في منزلك، ومحاولة تحقيق أقصى استفادة من المساحة وتحسين تدفق حركة المرور باستمرار، ولكن كل تعديل يعادل نقل الأثاث وإعادة ترتيبه، وهو أمر يستغرق وقتًا طويلاً ويتطلب الكثير من العمالة.

من أجل حل هذه المشكلة،أطلقت شركة Synopsys مشروع DSO.ai في عام 2020.هذا هو أول حل لتصميم الرقاقة في الصناعة يدمج الذكاء الاصطناعي والتحليل الإلكتروني للبيانت. يستخدم DSO.ai تقنية التعلم المعزز للبحث تلقائيًا في مساحة التصميم من خلال الذكاء الاصطناعي للعثور على أفضل نقطة توازن دون تدخل بشري. لقد تم استخدام هذه الأداة من قبل العديد من شركات الرقائق العملاقة.

على سبيل المثال، بعد استخدام DSO.ai، قامت Microsoft بتقليل استهلاك الطاقة لوحدات الشريحة بمقدار 10%-15% مع الحفاظ على الأداء؛ تمكنت شركة STMicroelectronics من زيادة كفاءة استكشاف PPA بأكثر من 3 مرات؛ كما قامت شركة SK Hynix العملاقة لشرائح الذاكرة بتقليص مساحة الشريحة بمقدار 5%. تظهر بيانات من Synopsys أن DSO.ai ساعد بنجاح في أكثر من 300 تسجيل تجاري، مما يشير إلى أن الذكاء الاصطناعي يلعب دورًا مهمًا في تصميم وإنتاج الشريحة الحقيقية.

وفيما يتعلق بالتحقق من الشريحة بمساعدة الذكاء الاصطناعي، أشار تقرير فني أصدرته شركة Synopsys أيضًا إلى أن عملية التحقق تستغرق ما يصل إلى 70% من دورة تطوير الشريحة بأكملها. تصل تكلفة تسجيل الشريحة إلى مئات الملايين من الدولارات، وتستمر تعقيدات الشرائح الحديثة في التزايد، لذلك يمكن تصور صعوبة التحقق. تحقيقا لهذه الغاية،أطلقت شركة Synopsys أداة VSO.ai.استخدم الذكاء الاصطناعي لتحسين مساحة التحقق وتسريع تقارب التغطية.

يمكن لـ VSO.ai استنتاج أنواع تغطية مختلفة لاستكمال تغطية الكود التقليدية، كما يمكن للذكاء الاصطناعي أيضًا التعلم من تجربة التحقق لتحسين أهداف التغطية بشكل مستمر. بالإضافة إلى ذلك، أطلقت شركة Synopsys أيضًا أداة TSO.ai، التي يمكنها مساعدة مطوري الرقائق في فحص الرقائق المعيبة التي تصنعها المصانع.

لقد أدى الانخراط العميق للذكاء الاصطناعي في مجال تصميم الرقائق إلى ظهور فكرة جريئة: هل يمكننا استخدام الذكاء الاصطناعي لتصميم شريحة كاملة؟ في الواقع، قامت شركة Nvidia بالفعل بمحاولات في هذا المجال. تصميم الدوائر من خلال وكلاء التعلم التعزيزي العميق،تم تصميم ما يقرب من 13000 دائرة في H100 من Nvidia بواسطة الذكاء الاصطناعي. كما استخدم معهد تكنولوجيا الحوسبة التابع للأكاديمية الصينية للعلوم الذكاء الاصطناعي لإنشاء شريحة معالج RISC-V تسمى "Enlightenment No. 1" في 5 ساعات.مع 4 ملايين بوابة منطقية، فإن أداءها قابل للمقارنة مع Intel 80486.

بشكل عام، لا تزال قدرة الذكاء الاصطناعي على تصميم شرائح كاملة محدودة، ولكن هذه بلا شك فرصة مهمة لتطوير الشرائح في المستقبل. مع التقدم المستمر للتكنولوجيا، سيتم استكشاف إمكانات الذكاء الاصطناعي في مجال تصميم الشريحة والاستفادة منها بشكل أكبر، وسوف يؤدي ذلك في النهاية إلى تغيير عملية تصميم الشريحة بأكملها.