HyperAIHyperAI

Command Palette

Search for a command to run...

محاضرة Stanford CS336: بناء نماذج لغوية من الصفر

تُعد دورة CS336 من جامعة ستانفورد برنامجًا مكثفًا يهدف إلى تمكين الطلاب والمهندسين من بناء نماذج لغوية من الصفر دون الاعتماد على المكتبات الجاهزة. تُصنف الدورة كمشروع برمجي ضخم يتطلب من المتعلمين تجاوز المفاهيم النظرية إلى التطبيق العملي الشامل الذي يشمل جمع البيانات وتنقيتها، وبناء بنية نموذج المحولات (Transformer)، وتدريب النموذج على أنظمة متوازية، وصولاً إلى التقييم والنشر. يهدف المساق إلى تزويد الطلاب بفهم عميق لكيفية عمل هذه النماذج التي شكلت العمود الفقري لتطبيقات الذكاء الاصطناعي الحديثة ومعالجة اللغة الطبيعية. تتطلب الدورة إتقانًا عاليًا للغة برمجة Python ومهارات هندسة برمجيات متقدمة، حيث يُتوقع من الطلاب كتابة كمية من الكود أكبر بعشر مرات من الدورات التقليدية، مع تقديم حد أدنى جدًا من الأكواد المسبقة. بالإضافة إلى ذلك، يشترط المساق خبرة مسبقة في التعلم العميق وأتمتة الأنظمة، بما في ذلك العمل على وحدات معالجة الرسومات (GPU) وتحسين الذاكرة، بالإضافة إلى أساسيات حسابية في الجبر الخطي والإحصاء والتعلم الآلي. يركز المحتوى بشكل كبير على كيفية تشغيل نماذج اللغة بسرعة وكفاءة عبر آلات متعددة، مما يجعلها دورة تتطلب استثمارًا كبيرًا في الوقت والموارد الحسابية. تتوزع منهجية التقييم على مجموعة من المهام العملية (Assignments) التي تمتد على مدار الفصل الدراسي. تتناول هذه المهام مواضيع متدرجة الصعوبة تشمل ترميز النصوص (Tokenization)، وبناء معماريات النماذج، وتحسينات الأداء باستخدام تقنيات مثل Triton، وإدارة التوازي في الحوسبة، وقوانين التوسع (Scaling Laws)، بالإضافة إلى عمليات الاستدلال (Inference) وضبط النموذج النهائي (Fine-tuning) عبر تقنيات مثل SFT و RLHF. تُدار المهام عبر جدول زمني محدد يبدأ بمراجعة المبادئ الأساسية وينتهي بتطبيقات متقدمة مثل التوافق متعدد الوسائط والذكاء الاصطناعي العام. تفرض الدورة سياسات صارمة لضمان النزاهة الأكاديمية. يُسمح بالدراسة الجماعية ولكن يجب أن يكون التسليم فرديًا، ويجب ذكر أسماء أعضاء المجموعة في بداية أي عمل مشترك. يُحظر استخدام أدوات الذكاء الاصطناعي مثل ChatGPT لحل المسائل مباشرة، كما يُنصح بشدة بتعطيل أدوات الاكتمال التلقائي المدعومة بالذكاء الاصطناعي داخل بيئات التطوير لضمان الفهم العميق للمحتوى. كما يمنع الاطلاع على أكواد جاهزة من الإنترنت، باستثناء ما هو محدد في الأدلة التعليمية، حيث يُركز المنهج على كتابة الكود من الصفر. بالنسبة للطلاب الذين يدرسون ذاتيًا عن بُعد، يوفر المساق خيارات للوصول إلى موارد حوسبة سحابية مدعومة من شركة Modal لتسهيل تشغيل النماذج على وحدات معالجة رسومية. يُنصح الطلاب بإجراء عمليات التصحيح الأولية على وحدات المعالجة المركزية (CPU) قبل الانتقال إلى وحدات المعالجة الرسومية لإتمام عمليات التدريب والتقييم. تُتاح محاضرات الدورة عبر قائمة تشغيل يوتيوب، وتُجرى محاضرات ضيوف من خبراء في المجال، مع مواعيد نهائية محددة لكل مهمة على منصة Gradescope، مما يوفر تجربة تعليمية متكاملة تركز على العمق التطبيقي والقدرة على بناء أنظمة ذكاء اصطناعي معقدة من الأسس الأولية.

الروابط ذات الصلة

محاضرة Stanford CS336: بناء نماذج لغوية من الصفر | القصص الشائعة | HyperAI