مراجعة الحدث | AMD/Muxi Integrated Circuit/ByteDance/جامعة بكين: تحليل متعمق لنظام التجميع الموحد عبر الأجهزة

في عصر النماذج الكبيرة، عادت المجمّعات إلى دائرة الضوء. في الخامس من يوليو، أقامت شركة HyperAI الدورة السابعة من معرض Meet AI Compiler Technology Salon في منطقة تشونغ قوان تسون ببكين، مع التركيز على الاتصالات الموزعة، ومجموعات تجميع وحدات معالجة الرسومات المحلية، وتصميم لغات البرمجة الجديدة، وبناء منظومة مفتوحة المصدر. ودُعي كبار خبراء المجمّعات من AMD، وMuxi Integrated Circuits، وByteDance، وجامعة بكين، لتقديم عرض منهجي للآليات الرئيسية وتفاصيل تنفيذ مشاريعهم الخاصة، بما في ذلك مساراتهم التقنية التي "يجري تنفيذها بالفعل وحققت إنجازات ملموسة".

اتبع حساب WeChat العام "HyperAI Super Neuro" وأجب على الكلمة الرئيسية "0705 AI Compiler" للحصول على عرض تقديمي للمحاضر المعتمد PPT.
في جلسة المائدة المستديرة، أدار الجلسة فنغ سيوان، الأستاذ المساعد في كلية شنغهاي تشوانغتشي وApache TVM PMC. ركز على موضوع "نظام تجميع موحد عبر الأجهزة"، وناقش بعمق مع أربعة محاضرين التعاون والتحديات التي تواجه منصات الأجهزة المختلفة.

لم يقتصر هذا الحدث على "النتاج المعرفي" للمحاضرين على المنصة، بل كان تفاعل شركاء المجتمع مثيرًا بنفس القدر. سواءً من خلال أسئلة متعمقة حول التفاصيل التقنية، أو مناقشات مطولة حول اختيار الحلول، أو تبادلات حرة خلال استراحات الشاي، فقد شارك الجميع تجاربهم ورؤاهم دون تحفظ، وأجروا نقاشًا وديًا وصادقًا حول المشكلات العملية التي واجهوها. هذا الجو "المتبادل" من شأنه أن يزيد من دفء مجتمعنا التقني! انتهى هذا الصالون التقني بامتياز.

مراجعة محتوى الحدث
فيما يلي مقدمة موجزة لمحتوى المشاركة والمقالة الفعلية للمشاركة.

شارك الموضوع:مساعدة مجتمع المصدر المفتوح، وتحليل مُجمِّع AMD Triton
محتويات:تريتون لغة برمجة اقترحتها شركة OpenAI، وهي مصممة لتبسيط تطوير نواة وحدة معالجة الرسومات (GPU) عالية الأداء. وقد استُخدمت على نطاق واسع في إطار تدريب المنطق السائد في برامج ماجستير إدارة الأعمال (LLM). يمكن للمستخدمين تنفيذ نواة وحدة معالجة الرسومات (GPU) من خلال تطوير شيفرة بايثون تريتون دون الحاجة إلى القلق بشأن تفاصيل بنية وحدة معالجة الرسومات الأساسية، مما يُخفف بشكل كبير من صعوبة تطوير شيفرة وحدة معالجة الرسومات.
قامت AMD بتنفيذ مُجمِّع Triton على منصات وحدة معالجة الرسوميات ذات الصلة وأرسلته إلى مجتمع Triton مفتوح المصدر.لتحسين أداء كود وحدة معالجة الرسومات (GPU)، عليك فهم مُجمِّع Triton ودوره في تحسين أداء نواة النظام. ستناقش هذه المشاركة مُجمِّع AMD Triton بالتفصيل، وتشرح كيف يُحسِّن المُجمِّع أداء Triton على منصات وحدات معالجة الرسومات من AMD.
شاهد جلسة المشاركة هذه وستتعلم:
1. مقدمة عن بنية وحدة معالجة الرسومات AMD
2. أحدث أعمال AMD GPU على مجتمع Triton مفتوح المصدر
انقر هنا لعرض سجل المشاركة الكامل:

شارك الموضوع:ممارسة تطبيق TVM على وحدة معالجة الرسومات Muxi
محتويات:تركز هذه المناقشة بشكل أساسي على كيفية تطبيق TVM على وحدة معالجة الرسوميات Muxi.بالنسبة لـ Muxi GPU، يتم إنشاء مشغلين عالي الأداء حول TVM لتمكين أطر عمل الذكاء الاصطناعي السائدة القائمة على TVM.
شاهد جلسة المشاركة هذه وستتعلم:
1. المشاكل التي قد تواجهها عند تكييف TVM مع GPGPU المحلي
2. ما هي فوائد TVM على GPGPU المحلية وما هي الجوانب التي تحتاج إلى المزيد من الاختراقات؟
3. حول حالة دعم مُجمِّعي الذكاء الاصطناعي مثل TVM على GPGPU المحلي، ومناقشة كيفية توسيع النظام البيئي ذي الصلة
انقر هنا لعرض سجل المشاركة الكامل:

شارك الموضوع:توزيع تريتون: برمجة بايثون الأصلية للاتصالات عالية الأداء
محتويات:يصل حجم الرقاقات الفردية تدريجيًا إلى حدٍّ من الاختناق. لا تستطيع المسرعات الفردية دعم تدريب نماذج اللغات الكبيرة والتفكير المنطقي. أصبحت الأنظمة الموزعة مطلبًا أساسيًا. تتزامن عمليات الحوسبة والوصول إلى الذاكرة والتواصل في الأنظمة الموزعة، ولكن غالبًا ما تُحسَّن الأطر الحالية بشكل مستقل، مما يُصعِّب إصدار أداء المجموعة بشكل تعاوني.
يقترح هذا التقرير توزيع Triton (امتداد مُجمِّع Triton)، وهو أول تقرير يدعو إلى تحسين التداخل الأصلي لأحمال عمل الذكاء الاصطناعي الموزعة ويغطي تحسين الأطر المتعددة.من خلال دمج أساسيات اتصال OpenSHMEM، واستخدام المترجم لتحقيق التحسين المشترك لثلاثة أنشطة، وإظهار تطبيق التكنولوجيا المتداخلة وطرق البرمجة ذات العقدة الواحدة/المتعددة، يستخدم الكود الناتج الموارد غير المتجانسة بالكامل في بيئة مجموعة، متفوقًا على الكود المحسن يدويًا، وتكلفة التطوير أقل بكثير من CUDA/C++.
شاهد جلسة المشاركة هذه وستتعلم:
1. أحدث التقنيات الموزعة بواسطة تريتون
2. تحديات برمجة الاتصالات من بايثون
3. الاتجاه المستقبلي للتجميع الموزع
انقر هنا لعرض سجل المشاركة الكامل:

شارك الموضوع:TileLang: لم يعد تطوير المشغل "يحرق الدماغ"، ولا يزال الأداء متصلاً بالإنترنت
محتويات:هذه المرة نقدم لكم لغة برمجة مشغل جديدة - TileLang.من خلال البدائيات الواضحة على مستوى البلاط وآليات التفكير التلقائي، فإنه يتيح للمطورين تنفيذ مشغلي الأعصاب الواعي للأجهزة بكفاءة، وتحقيق التوازن بين التحكم وكفاءة التطوير.
شاهد جلسة المشاركة هذه وستتعلم:
1. إتقان لغة تطوير مشغل عالية الأداء وأكثر بساطة وكفاءة
2. فهم مفهوم التصميم الأساسي لـ TileLang والمزايا التقنية
انقر هنا لعرض سجل المشاركة الكامل:
2025 تعرف على AI Compiler · ترقبوا المزيد
من عام ٢٠٢٣ إلى عام ٢٠٢٥، نجحنا في عقد ٧ لقاءات افتراضية في بكين وشانغهاي وشنتشن، جمعت آلاف الممارسين والمتحمسين، وأنشأنا تدريجيًا منظومة مجتمعية غنية. في عام ٢٠٢٥، سنواصل تطوير خريطة مدينة مُجمّع الذكاء الاصطناعي، وندعو جميع الشركات وشركاء المجتمع بصدق للمشاركة في الإبداع المشترك بمختلف الأشكال، سواءً من خلال ترشيح محاضرين أو توفير أماكن واستراحات قهوة، فنحن نرحب بهم بشدة.
لنعمل معًا على إنشاء مجتمع مُجمّعي الذكاء الاصطناعي الأكثر نشاطًا في الصين! وأخيرًا، لنشارككم صورة جماعية من المشهد ❤️

المنظمون والشركاء

باعتبارها مجتمعًا رائدًا دوليًا في مجال الذكاء الاصطناعي والحوسبة عالية الأداء، تهدف HyperAI (hyper.ai) إلى مساعدة المطورين والمتحمسين في صناعة علوم البيانات والذكاء الاصطناعي العالمية على التعلم والفهم والممارسة من خلال توفير سلسلة من الخدمات مثل تقارير معلومات الصناعة، وتنزيلات مجموعات البيانات السريعة، وعروض تعليمية عبر الإنترنت، وتقييمات أداء النماذج الشائعة، وتوصيات الأوراق البحثية المتطورة، وتفسيرات النتائج عالية القيمة، وتكامل تقويم المؤتمرات العليا، وبناء مستقبل الذكاء الاصطناعي مع المجتمع.
قم بزيارة الموقع الرسمي:https://hyper.ai/

OpenBayes Bayesian Computing هي شركة رائدة في تقديم خدمات الحوسبة عالية الأداء في الصينمن خلال دمج أنظمة البرمجيات الكلاسيكية ونماذج التعلم الآلي على شرائح غير متجانسة من الجيل الجديد، فإنها توفر للمؤسسات الصناعية والبحث العلمي الجامعي منتجات حوسبة علوم البيانات أسرع وأسهل في الاستخدام. وقد تم اعتماد منتجاتها من قبل العشرات من السيناريوهات الصناعية الكبرى أو معاهد البحوث العلمية الرائدة.
قم بزيارة الموقع الرسمي:https://openbayes.com/

تأسس مجتمع MLC.AI في يونيو 2022. قاد تشين تيانكي، المخترع الرئيسي لـ Apache TVM والباحث الشاب المعروف في مجال التعلم الآلي، الفريق لإطلاق دورة MLC عبر الإنترنت، والتي قدمت بشكل منهجي العناصر الرئيسية والمفاهيم الأساسية لتجميع التعلم الآلي.
في نوفمبر 2022، وبفضل الجهود المشتركة لمتطوعي مجتمع MLC.AI، تم إطلاق أول وثائق TVM الصينية الكاملة وتم استضافتها بنجاح على الموقع الرسمي لـ HyperAI، مما يوفر للمطورين المحليين المهتمين بتجميع التعلم الآلي الإعدادات الأساسية للوصول إلى تقنية جديدة وتعلمها - الوثائق.
دورات MLC عبر الإنترنت:https://mlc.ai/
وثائق TVM الصينية:https://tvm.hyper.ai/

تأسست شركة "غاراج كوفي" في أبريل 2011، وهي من أوائل الشركات في الصين التي ركزت على شركات الإنترنت الناشئة في مراحلها المبكرة. وقد أنشأت منصة خدمات ابتكار وريادة أعمال مفتوحة، منخفضة التكلفة، وسهلة الاستخدام، وشاملة، لرواد الأعمال في مراحلهم المبكرة، تتمحور حول مفهوم "ريادة الأعمال الجماعية".
كأول مساحة إبداعية في شارع تشونغ قوان تسون لريادة الأعمال ببكين، يستخدم مقهى "غاراج كوفي" المقاهي كمنصة تفاعلية لتوفير مساحات مكتبية تفاعلية وخدمات حضانة لفرق ريادة الأعمال، مما يُتيح لهم المشاركة والترويج المشترك والتكامل والتعايش. يُعد "غاراج كوفي" أول مقهى في العالم يُعنى بريادة الأعمال، وهو أكثر مساحات الإبداع الوطنية تأثيرًا في الصين، ومنصة الابتكار وريادة الأعمال الدولية.
دعم الحدث

احصل على PPT:اتبع حساب WeChat العام "HyperAI Super Neuro" وأجب على الكلمة الرئيسية "0705 AI Compiler" للحصول على عرض تقديمي للمحاضر المعتمد PPT.
امسح رمز الاستجابة السريعة للانضمام إلى مجموعة الحدث⬇️
