HyperAIHyperAI
منذ 2 أشهر

Cluster-GCN: خوارزمية فعالة لتدريب شبكات التجميع الرسمية العميقة والكبيرة

Wei-Lin Chiang; Xuanqing Liu; Si Si; Yang Li; Samy Bengio; Cho-Jui Hsieh
Cluster-GCN: خوارزمية فعالة لتدريب شبكات التجميع الرسمية العميقة والكبيرة
الملخص

تم تطبيق شبكات التجميع الرسومية (GCN) بنجاح في العديد من التطبيقات القائمة على الرسم البياني، ومع ذلك لا يزال تدريب GCN على نطاق واسع يمثل تحديًا. تعاني الخوارزميات الحالية المستندة إلى SGD إما من تكلفة حسابية عالية تتزايد بشكل أسي مع زيادة عدد طبقات GCN، أو من متطلبات مساحة كبيرة لحفظ الرسم البياني بأكمله والتمثيل المضمن لكل عقدة في الذاكرة. في هذا البحث، نقترح Cluster-GCN، وهي خوارزمية GCN جديدة تناسب التدريب المستند إلى SGD من خلال استغلال هيكل التجميع في الرسم البياني. يعمل Cluster-GCN كالتالي: في كل خطوة، يقوم بعينة مجموعة من العقد التي ترتبط بجزء كثيف من الرسم البياني تم تحديده بواسطة خوارزمية تجميع الرسم البياني، ويحد من البحث عن الجيران داخل هذا الجزء الكثيف فقط. هذه الاستراتيجية البسيطة ولكن الفعالة تؤدي إلى تحسين كبير في كفاءة الذاكرة والحسبة الحسابية مع القدرة على تحقيق دقة اختبار مماثلة للخوارزميات السابقة. لاختبار قابلية توسع خوارزميتنا، قمنا بإنشاء بيانات Amazon2M الجديدة التي تحتوي على 2 مليون عقدة و61 مليون حافة، وهي أكبر بمزيد من 5 مرات من البيانات العامة الأكبر المتاحة سابقًا (Reddit). بالنسبة لتدريب GCN ثلاثي الطبقات على هذه البيانات، يكون Cluster-GCN أسرع من أفضل الخوارزميات السابقة VR-GCN (1523 ثانية مقابل 1961 ثانية) ويستخدم ذاكرة أقل بكثير (2.2 جيجابايت مقابل 11.2 جيجابايت). بالإضافة إلى ذلك، بالنسبة لتدريب GCN رباعي الطبقات على هذه البيانات، يمكن لخوارزميتنا إكمال العملية في حوالي 36 دقيقة بينما فشلت جميع الخوارزميات الحالية لتدريب GCN بسبب مشكلة نفاد الذاكرة. علاوةً على ذلك، يتيح لنا Cluster-GCN تدريب شبكات GCN أعمق بكثير دون زيادة كبيرة في الوقت أو استخدام الذاكرة، مما يؤدي إلى تحسين دقة التنبؤ---باستخدام GCN خماسي الطبقات بواسطة Cluster-GCN، حققنا أعلى درجة F1 اختبارية حتى الآن على مجموعة بيانات PPI بنسبة 99.36% بينما كانت النتيجة الأفضل سابقًا 98.71% بواسطة [16]. رموز البرامج الخاصة بنا متاحة للجمهور عبر الرابط https://github.com/google-research/google-research/tree/master/cluster_gcn.

Cluster-GCN: خوارزمية فعالة لتدريب شبكات التجميع الرسمية العميقة والكبيرة | أحدث الأوراق البحثية | HyperAI