GraphVite: نظام هجين عالي الأداء لتمثيل العقد بين وحدة المعالجة المركزية ووحدة معالجة الرسومات

تعلم التمثيلات المستمرة للعقد يجذب اهتمامًا متزايدًا في الأوساط الأكاديمية والصناعية مؤخرًا، نظرًا لبساطتها وفعاليتها في مجموعة متنوعة من التطبيقات. ومع ذلك، فإن معظم خوارزميات وأنظمة التضمين الحالية للعقد قادرة على معالجة شبكات تحتوي على مئات الآلاف أو بضعة ملايين من العقد. ولكن، كيفية توسيع نطاق هذه الخوارزميات لأنظمة تحتوي على عشرات الملايين أو حتى مئات الملايين من العقد لا تزال مشكلة صعبة.في هذا البحث، نقترح نظام GraphVite (جراف فايت)، وهو نظام هجين عالي الأداء يعمل بالمعالج المركزي (CPU) والمعالج الرسومي (GPU) لتدريب تمثيلات العقد، وذلك من خلال تحسين الخوارزمية والنظام معًا. على جانب المعالج المركزي (CPU)، يتم إنشاء عينات حواف مكملة بشكل متوازي عبر المشي العشوائي في الشبكة بطريقة حية، وتُستخدم كبيانات تدريب. وعلى جانب المعالج الرسومي (GPU)، تم اقتراح استراتيجية عينة سلبية متوازية جديدة تستفيد من عدة معالجات رسومية لتدريب تمثيلات العقد بشكل متزامن، مع الحد الأدنى من نقل البيانات والتناسق.بالإضافة إلى ذلك، تم اقتراح استراتيجية تعاون فعالة لتقليل تكلفة التناسق بين المعالجات المركزية (CPUs) والمعالجات الرسومية (GPUs). أظهرت التجارب التي أجريت على شبكات حقيقية متعددة أن GraphVite (جراف فايت) فائق الكفاءة. فهو يستغرق حوالي دقيقة واحدة فقط لشبكة تحتوي على مليون عقد وخمسة ملايين حافة باستخدام جهاز واحد به أربعة معالجات رسومية (GPUs)، ويستغرق حوالي 20 ساعة لشبكة تحتوي على 66 مليون عقد و1.8 مليار حافة. بالمقارنة مع النظام الأسرع حاليًا، فإن GraphVite (جراف فايت) أسرع بنحو 50 مرة دون أي تضحية بالأداء.