HyperAIHyperAI

Command Palette

Search for a command to run...

FireCaffe: التسارع شبه الخطي لتدريب الشبكات العصبية العميقة علىusters الحوسبة

Forrest N. Iandola Khalid Ashraf Matthew W. Moskewicz Kurt Keutzer

الملخص

أوقات التدريب الطويلة للشبكات العصبية العميقة ذات الدقة العالية (DNNs) تعوق البحث في هياكل شبكات عصبية عميقة جديدة وتبطئ تطوير الشبكات العصبية العميقة ذات الدقة العالية. في هذا البحث، نقدم FireCaffe، وهي أداة تحقق بنجاح توسيع نطاق تدريب الشبكات العصبية العميقة عبر مجموعة من وحدات معالجة الرسومات (GPUs). كما نقدم عددًا من أفضل الممارسات لمساعدة في مقارنة التطورات في الطرق المستخدمة لتوسيع نطاق وتسريع تدريب الشبكات العصبية العميقة. إن سرعة وخفة الخوارزميات الموزعة تقيد دائمًا تقريبًا بالتكاليف الإضافية للتواصل بين الخوادم؛ وليس تدريب DNN استثناءً لهذه القاعدة. لذلك، فإن الاعتبار الرئيسي هنا هو خفض تكاليف التواصل قدر الإمكان دون المساس بدقة نماذج DNN التي نتدرب عليها. يرتكز نهجنا على ثلاثة أعمدة رئيسية. الأول، نختار الأجهزة الشبكية التي تحقق حزمة بيانات عالية بين خوادم GPU -- تعتبر شبكات Infiniband أو Cray مثالية لهذا الغرض. الثاني، ندرس عددًا من خوارزميات التواصل، ونجد أن الأشجار التقليلية أكثر كفاءة وخفة من النهج التقليدي لخادم المعلمات. الثالث، يمكننا زيادة حجم الدفعة بشكل اختياري لتقليل الكمية الإجمالية للتواصل أثناء تدريب DNN، ونحدد المعلمات الفائقة التي تسمح لنا بإعادة إنتاج دقة الدفع الصغيرة أثناء التدريب بدفع كبيرة. عند تدريب GoogLeNet وNetwork-in-Network على ImageNet، نحقق سرعة أكبر بمقدار 47 مرة و39 مرة على التوالي عند استخدام مجموعة تتكون من 128 GPU.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp