Command Palette
Search for a command to run...
Yujun Lin Zhekai Zhang Song Han

الملخص
تتطلب التطبيقات الحديثة للـ tensors، وخاصة النماذج الأساسية (foundation models) وتطبيقات الذكاء الاصطناعي التوليدي (generative AI)، تعددًا في وسائط الإدخال (بما في ذلك الرؤية واللغة)، مما يزيد من الحاجة إلى هياكل متسقة للتسريع (accelerator architecture مرنّة. تعاني الإطارات الحالية من تناقض بين المرونة في التصميم وإنتاجية توليد الشفرة RTL (Register-Transfer Level): إما أنها محدودة جدًا بنماذج يدوية مُعدّة مسبقًا، أو لا تستطيع توليد الشفرة RTL تلقائيًا. ولحل هذه التحديات، نقترح إطار العمل LEGO، الذي يركز على تطبيقات التنسور، ويُولّد تلقائيًا تصميمات البنية المكانية (spatial architecture) ويُخرِج شفرة RTL قابلة للتركيب دون الحاجة إلى نماذج يدوية لشفرة RTL. وباستخدام تمثيل هندسي مبني على التحويلات التماثلية (affine-transformation-based architecture representation)، يُحدِّد جزء LEGO الأمامي الاتصالات بين الوحدات الوظيفية، ويُولّد نظام الذاكرة، ويُدمج تصاميم تدفق البيانات المكانية المختلفة بناءً على تحليل إعادة استخدام البيانات. ثم يقوم جزء LEGO الخلفي بتحويل المكونات المادية إلى رسم بياني على مستوى العناصر الأساسية (primitive-level graph) لإجراء تحسينات على المستوى الأدنى، ويُطبّق مجموعة من خوارزميات البرمجة الخطية لوضع السجلات المُتسلسلة (pipeline registers) بشكل مثالي، وتقليل عبء المنطق غير المستخدم عند التبديل بين تصاميم تدفق البيانات المكانية. وقد أظهرت تقييماتنا أن LEGO يمكن أن تحقق تسريعًا بنسبة 3.2 مرة وتحسينًا في كفاءة الطاقة بنسبة 2.4 مرة مقارنةً بالعمل السابق (Gemmini)، كما يمكنها توليد بنية واحدة قادرة على دعم نماذج أساسية حديثة متنوعة في تطبيقات الذكاء الاصطناعي التوليدي.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.