HyperAIHyperAI
منذ 9 أيام

BOLT: إطار تعلم عميق تلقائي لتدريب ونشر نماذج البحث والاقتراح على نطاق واسع على معدات معالجات CPU شائعة

Nicholas Meisburger, Vihan Lakshman, Benito Geordie, Joshua Engels, David Torres Ramos, Pratik Pranav, Benjamin Coleman, Benjamin Meisburger, Shubh Gupta, Yashwanth Adunukota, Tharun Medini, Anshumali Shrivastava
BOLT: إطار تعلم عميق تلقائي لتدريب ونشر نماذج البحث والاقتراح على نطاق واسع على معدات معالجات CPU شائعة
الملخص

يُعد التدريب والاستنتاج الفعّال للشبكات العصبية الضخمة على معدات المعالجات المركزية (CPU) الشائعة أهمية عملية كبيرة في تمكين الوصول إلى قدرات التعلم العميق (DL) على نطاق واسع. في الوقت الحالي، يتطلب عملية تدريب النماذج الضخمة التي تتكون من مئات الملايين إلى مليارات المعاملات استخدامًا واسعًا لمُسرّعات مُخصصة، مثل وحدات معالجة الرسومات (GPU)، والتي تكون متاحة فقط لعدد محدود من المؤسسات التي تمتلك موارد مالية كبيرة. علاوة على ذلك، غالبًا ما يترافق تدريب ونشر هذه النماذج مع أثر بيئي مقلق من حيث الانبعاثات الكربونية. في هذا البحث، نتقدّم خطوة نحو معالجة هذه التحديات من خلال تقديم BOLT، وهي مكتبة لتعلم العميق النادر مُصممة لتدريب نماذج البحث والتوصية الضخمة على معدات معالجات مركزية قياسية. توفر BOLT واجهة برمجة تطبيقات (API) مرنة وعالية المستوى لبناء النماذج، وهي مألوفة للمستخدمين الذين يتعاملون مع الأطر الشهيرة لتعلم العميق الحالية. وبفضل التحكم التلقائي في المعاملات الفائقة المخصصة، تُبقي BOLT بعيدًا عن التفاصيل الخوارزمية المتعلقة بتدريب الشبكات النادرة. تم تقييم BOLT على مجموعة متنوعة من مهام استرجاع المعلومات، بما في ذلك التوصيات بالمنتجات، وتصنيف النصوص، والشبكات العصبية الرسومية، والتهيئة الشخصية. ونجد أن النظام المقترح يحقق أداءً تنافسيًا مع أحدث التقنيات، وبتكلفة وانبعاثات طاقة تقل عن جزء ضئيل، وبزمن استنتاج أسرع بمرتبة واحدة من القيمة العشرية. وقد تم بالفعل تطبيق BOLT بنجاح من قبل عدة شركات لحل مشكلات حاسمة، ونسلط الضوء على دراسة حالة واحدة من العملاء في مجال التجارة الإلكترونية.

BOLT: إطار تعلم عميق تلقائي لتدريب ونشر نماذج البحث والاقتراح على نطاق واسع على معدات معالجات CPU شائعة | أحدث الأوراق البحثية | HyperAI