HyperAIHyperAI

Command Palette

Search for a command to run...

معاينة الحدث | تتعاون شركات AI Computing وTileRT وTencent وHuawei وAI Computing Innovation لاستكشاف التحسين التعاوني متعدد المستويات

Featured Image

من حرارة بكين اللاهبة إلى شتاء شنغهاي القارس، رافقت فعالية "لقاء مع مُجمِّع الذكاء الاصطناعي" التقنية، التي تستضيفها شركة HyperAI، منظومة تجميع الذكاء الاصطناعي على مدار ثلاث سنوات. خلال هذه السنوات الثلاث، شهدنا مشاركة عدد لا يُحصى من المهندسين والباحثين لأحدث الاكتشافات وتبادل وجهات النظر التقنية، مما ساهم بشكل مشترك في دفع عجلة التطور المستمر لتقنية التجميع في عصر النماذج الضخمة، ودفع حدود تحسين الأداء والتكيف مع بيئات متنوعة والتنفيذ الهندسي بشكل متواصل.

تتطور التكنولوجيا باستمرار، ولم تتوقف خطواتنا للتواصل مع أحدث الابتكارات. في الأول من أغسطس، ستنطلق فعاليات الصالون التقني التاسع "Meet AI Compiler" مجدداً في بكين!في هذا العدد، استضفنا نخبة من الخبراء من أكاديمية الذكاء الاصطناعي، وفريق TileRT، وشركة Tencent، وشركة Huawei Ascend، وشركة Zhiyuan Innovation. سيُجرون تحليلاً معمقاً لتوسيع لغة FlagTree، والاستدلال فائق السرعة في TileRT، وتحسين مُعامل FalconGEMM، والبناء المشترك مفتوح المصدر لـ AscendNPU IR، وممارسات التطبيق في مجال الذكاء المُجسّد، بهدف تقديم صورة شاملة للتطور التعاوني لمُترجمات الذكاء الاصطناعي على مستويات متعددة، تشمل التعبير اللغوي، وحساب المُعاملات، وتنفيذ الاستدلال، وتطبيق السيناريوهات.

كما هو الحال دائماً، المقاعد محدودة، لذا سارعوا بالحجز! احجزوا مقاعدكم الآن، ونراكم هناك!

تفاصيل الحدث

⏰ الوقت: 1 أغسطس (السبت) 13:30-17:30

📍 الموقع: القاعة متعددة الأغراض، الطابق الخامس، المبنى رقم ١٢، شارع تشونغ قوان تسون لريادة الأعمال، حي هايديان، بكين

👬 عدد المشاركين: 150 (عدد المقاعد المتاحة محدود، يرجى التسجيل في أقرب وقت ممكن) 

🙌🏻 رابط التسجيل:https://hdxu.cn/1KkIr

قم بمسح رمز الاستجابة السريعة (QR) ولاحظ "AI Compiler" للانضمام إلى مجموعة الحدث:

الضيوف وجدول الأعمال

الجلسة الأولى: المتحدثون الضيوف

شارك الموضوع:FlagTree: امتدادات لغة Triton-TLE، وواجهة Tile IR الخلفية، وممارسات تحسين المُصرّف

محتويات:سيُقسّم هذا العرض التقديمي إلى ثلاثة أجزاء. يُقدّم الجزء الأول التحديات التي تواجهها لغة Triton، وكيف تُتيح تقنية TLE (المُعاملات المُتتبّعة) الكشف التدريجي عن تفاصيل الأجهزة من خلال ثلاثة مستويات من امتدادات اللغة، مما يُحقق توازنًا أفضل بين قابلية النقل والصيانة والأداء. يُركّز الجزء الثاني على الممارسة الهندسية لدمج Tile IR في FlagTree الخاص بمُصرّف Triton، مُوضّحًا كيف يُوسّع هذا النوع الجديد من الواجهة الخلفية للمُصرّف نطاق تحسين أداء مُعاملات Triton. أما الجزء الثالث، فسيُحلّل بشكل منهجي تقنيات تحسين المُصرّف الرئيسية، مثل تحسين التخطيط وإعادة ترتيب التعليمات، مُقدّمًا مسارًا كاملاً لتحسين عملية التجميع للمُعاملات عالية الأداء عبر الشرائح.

شاهد جلسة المشاركة هذه وستتعلم:

1. كيف تتحكم TLE في الذاكرة الموجودة على الشريحة، وكيف تعبر عن النماذج الموزعة ونماذج المنتج والمستهلك، وكيف تقوم بتضمين اللغة الأصلية للبائع؟

2. كيف يمكن لتقنيات TLE و Tile IR الخلفية تحسين الحد الأقصى لأداء مشغلي مفاتيح Triton؟

3. كيف تعمل تقنيات تحسين المترجم على تقليل الحمل الزائد لتحويل تخطيط البيانات، وتحسين كفاءة تنفيذ التعليمات، وإطلاق العنان لأداء عامل التشغيل Triton بشكل أكبر.

شارك الموضوع:TileRT: السرعة هي الذكاء - الاستكشاف الحسابي والتصميم المشترك لاستنتاج النماذج الكبيرة بزمن استجابة منخفض للغاية

محتويات:مع وصول النماذج الضخمة إلى تريليونات المعاملات ودخولها عصر الذكاء الاصطناعي، أصبحت سرعة الاستدلال الفائقة عنصرًا أساسيًا لدعم تدفقات المهام المعقدة وإطلاق العنان الكامل لإمكانات النموذج. ومع ذلك، عندما تحاول الأنظمة تجاوز حدود زمن الاستجابة، غالبًا ما تصبح بنى الأنظمة التقليدية واختناقات التنفيذ عقبات لا يمكن التغلب عليها.

يقدم هذا التقرير أحدث الاستكشافات لـ TileRT، موضحًا كيفية بناء حزمة برمجية لحساب النماذج واسعة النطاق مع زمن استجابة منخفض للغاية، من منظور مترجمات الذكاء الاصطناعي، وتطور بنية وقت التشغيل إلى التصميم المشترك لنظام النموذج.

شاهد جلسة المشاركة هذه وستتعلم:

1. السرعة هي الذكاء: استكشاف لماذا أصبحت "السرعة" تدريجياً مؤشراً رئيسياً لجانب الاستدلال في النماذج الكبيرة في عصر الفاعلية.

2. استكشاف بنية النظام: يقدم هذا القسم التطور المعماري لـ TileRT، باستخدام GLM-5 كمثال لمناقشة كيفية تحسين أداء الاستدلال بشكل كبير عن طريق إعادة هيكلة جدولة الحساب الأساسية.

3. تصميم النماذج والأنظمة المشتركة وممارسة الإنتاج: مشاركة كيفية التغلب على عنق الزجاجة في سرعة 1000 معاملة في الثانية في الاستدلال أحادي الدفعة لنماذج ذات تريليون معلمة من خلال التصميم المشترك للنماذج والأنظمة.

شارك الموضوع:FalconGEMM: تجاوز ذروة أداء الأجهزة بضرب المصفوفات ذي التعقيد المنخفض

محتويات:يُعدّ ضرب المصفوفات (GEMM) جوهر القدرة الحاسوبية لتدريب النماذج الكبيرة واستنتاجها. مع ذلك، ومع تزايد حجم النموذج بشكلٍ هائل، يقترب تعقيد الخوارزمية القياسية O(N³) باستمرار من الحد الأقصى لقدرة الجهاز. لذا، أصبح الحفاظ على الأداء الأمثل عند بلوغ قدرة الحوسبة ذروتها تحديًا رئيسيًا لبنية النماذج الكبيرة. يُعدّ فهم مبادئ وقيمة وتحديات هندسة ضرب المصفوفات منخفض التعقيد، وتجاوز سقف الأداء في سياق تحسين العمليات الذي يصل إلى ذروته، أمرًا بالغ الأهمية. أحد المسارات التي استكشفها المجتمع الرياضي لأكثر من 50 عامًا هو ضرب المصفوفات منخفض التعقيد (LCMA، مثل Strassen وAlphaTensor) - أي استبدال عدد أقل من عمليات الضرب بمزيد من عمليات الوصول إلى الذاكرة والجمع، وبالتالي "تجاوز" الحد الأقصى لقدرة الجهاز. مع ذلك، أبقت التحديات الهندسية الرئيسية الثلاثة، وهي تضخم الوصول إلى الذاكرة، واختيار الخوارزمية، وقابلية النقل عبر المنصات، هذا الأسلوب في المستوى النظري لفترة طويلة.

يقدم هذا التقرير مشروع FalconGEMM، الذي ينقل خوارزمية LCMA من مرحلة التصميم النظري إلى بيئة برمجية جاهزة للاستخدام، وذلك عبر ثلاثة مستويات: توليد الكود تلقائيًا بواسطة المُصرّف، وتحسين الوصول إلى الذاكرة من خلال دمج البيانات المتوازية الجماعية، واتخاذ قرارات الخوارزمية بناءً على نماذج الأداء. كما يحقق المشروع تفوقًا شاملًا على المكتبات الرسمية الرائدة على مختلف منصات وحدات المعالجة المركزية ووحدات معالجة الرسومات، بالإضافة إلى معالجة أحمال العمل الحقيقية ذات النماذج الكبيرة.

شاهد جلسة المشاركة هذه وستتعلم:

1. فهم المبادئ والقيمة والتحديات الهندسية لضرب المصفوفات منخفضة التعقيد التي تتجاوز سقف الأداء عندما يصل تحسين المشغل إلى حده الأقصى.

  1. الحلول التقنية والممارسات متعددة المنصات لشركة FalconGEMM.

شارك الموضوع:AscendNPU IR: منصة التجميع مفتوحة المصدر وتدعم التكامل متعدد اللغات مع Ascend.

محتويات:أصبح AscendNPU IR، وهو مكون مُصرّف Ascend، مفتوح المصدر بالكامل. وباعتباره طبقة الوصول MLIR لـ Ascend إلى أُطر البرمجة الخارجية، فإنه يوفر تكاملاً مرنًا، وتعبيرًا كاملاً، وقدرات تحسين تجميع متوافقة مع Ascend، ويدعم العديد من لغات البرمجة الخاصة بالمجال (DSL) لتحسين أداء مُعاملات Ascend.

شاهد جلسة المشاركة هذه وستتعلم:

1. فهم البنية التقنية العامة وفلسفة التصميم لـ AscendNPU IR.

2. فهم الميزات الجديدة لـ Ascend NPU IR لتوسيع Ascend 950.

3. فهم أنشطة بناء مجتمع AscendNPU IR وكيفية المشاركة فيها.

شارك الموضوع:مُجمِّع ذكاء اصطناعي للأغراض العامة في مجال الذكاء المُجسَّد

محتويات:يقدم هذا التقرير مترجمًا للأغراض العامة للذكاء المجسد والنماذج الكبيرة متعددة الوسائط، مع التركيز على التقاط وتصدير وتجميع وتجميع ونشر وقت التشغيل وتحسين أداء خطوط أنابيب الخوارزمية الكاملة، ومعالجة القضايا الرئيسية في التسليم على الحافة والتشغيل المستقر والتكيف عبر الأطر وتوسيع نطاق هندسة نماذج الروبوت.

شاهد جلسة المشاركة هذه وستتعلم:

1. فهم التحديات الأساسية التي تميز نشر نموذج الذكاء المجسد عن نشر النموذج التقليدي، بما في ذلك التعقيد الهندسي وتكاليف الصيانة الناتجة عن النماذج المتعددة والأطر المتعددة وخطوط الأنابيب متعددة المراحل.

2. إتقان كيفية قيام المترجم العام بالتقاط تدفق الخوارزمية الكامل من خلال التتبع الديناميكي، وتنظيم الوحدات النمطية مثل المعالجة المسبقة، ونموذج VLA، وLLM، والمعالجة اللاحقة في قالب DAG قابل للتجميع والنشر.

3. فهم كيفية دعم التجميع المجمع وبنية وقت التشغيل الموحدة للخلفيات المختلفة، والاستفادة من مزايا الرقائق المختلفة مع الحفاظ على سلسلة تسليم موحدة.

4. فهم نموذج الواجهة بين مترجم المجال المجسد ومنصة التوزيع.

المنظمون والشركاء

HyperAI (hyper.ai) هي شركة رائدة عالميًا في مجال الذكاء الاصطناعي والحوسبة عالية الأداء.ويهدف إلى مساعدة المطورين والمتحمسين في صناعة علوم البيانات والذكاء الاصطناعي العالمية على التعلم والفهم والممارسة من خلال توفير سلسلة من الخدمات مثل تقارير معلومات الصناعة، وتنزيلات مجموعات البيانات السريعة، وعروض البرامج التعليمية عبر الإنترنت، وتقييمات أداء النماذج الشائعة، وتوصيات الأوراق البحثية المتطورة، وتفسيرات النتائج عالية القيمة، وتكامل تقويم المؤتمرات العليا، وبناء مستقبل الذكاء الاصطناعي مع المجتمع.

قم بزيارة الموقع الرسمي:https://hyper.ai/

OpenBayes Bayesian Computing هي شركة رائدة في تقديم خدمات الحوسبة عالية الأداء في الصينمن خلال دمج أنظمة البرمجيات الكلاسيكية ونماذج التعلم الآلي على شرائح غير متجانسة من الجيل الجديد، فإنها توفر للمؤسسات الصناعية والبحث العلمي الجامعي منتجات حوسبة علوم البيانات أسرع وأسهل في الاستخدام. وقد تم اعتماد منتجاتها من قبل العشرات من السيناريوهات الصناعية الكبرى أو معاهد البحوث العلمية الرائدة.

قم بزيارة الموقع الرسمي:https://openbayes.com/

تأسس مجتمع MLC.AI في يونيو 2022. قاد تشين تيانكي، المخترع الرئيسي لـ Apache TVM والباحث الشاب المعروف في مجال التعلم الآلي، الفريق لإطلاق دورة MLC عبر الإنترنت، والتي قدمت بشكل منهجي العناصر الرئيسية والمفاهيم الأساسية لتجميع التعلم الآلي.

في نوفمبر 2022، وبفضل الجهود المشتركة لمتطوعي مجتمع MLC.AI، تم إطلاق أول وثائق TVM الصينية الكاملة وتم استضافتها بنجاح على الموقع الرسمي لـ HyperAI، مما يوفر للمطورين المحليين المهتمين بتجميع التعلم الآلي الإعدادات الأساسية للوصول إلى تقنية جديدة وتعلمها - الوثائق.

دورات MLC عبر الإنترنت:https://mlc.ai/

وثائق TVM الصينية:https://tvm.hyper.ai/

دعم أماكن الفعاليات

تم توفير مكان إقامة هذا الحدث من قبل اللجنة الإدارية لمدينة تشونغقوانتسون العلمية وشركة بكين تشونغقوانتسون العلمية لتطوير الابتكار المحدودة.

الصف النشط:امسح رمز الاستجابة السريعة للانتقال إلى تسجيل الحدث

امسح رمز الاستجابة السريعة (QR) ولاحظ "AI Compiler" للانضمام إلى مجموعة الحدث

نظراً لمحدودية المساحة المتاحة، تم فتح 150 مقعداً فقط. ننصحكم بالتسجيل في أقرب وقت ممكن لحجز مقعدكم.

نراكم هناك في الأول من أغسطس، من الساعة 13:30 إلى الساعة 17:30!