شبكات GAN أكثر تعقيدًا بآلاف المرات، لكن السلامة هي الأهم

بقلم سوبر نيرو
تشكل الشبكات العصبية التوليدية التنافسية (GANs) مفتاحًا للخطوة التالية في تطوير التعلم العميق (ML)، ولديها آفاق تطبيقية عظيمة في العديد من المجالات.
لكن ازدهار شبكات GAN لا يزال بحاجة إلى التغلب على جبلين من الأجهزة والإطار.

ماذا؟ شبكة GAN
بالنسبة لتطوير شبكات GAN، ربما تكون الاستراتيجية المجدية هي احتلال السوق في مجالات الصور والفيديو أولاً ثم الانتقال إلى مجالات أخرى. على سبيل المثال، يمكن استخدام مجموعات البيانات المحاكاة لتطبيقات HPC (مجموعة أجهزة الكمبيوتر عالية الأداء).
ومع ذلك، لا يزال من غير المعروف متى سيصبح التطوير المنسق للبنية الأساسية والبرمجيات قادراً على التكيف مع المزيد من التطبيقات. ومع ذلك، فإن دور وتأثير شبكات GANs ملحوظان بما يكفي لإنجاز العمل المستهدف والتحضير للمرحلة التالية من الذكاء الاصطناعي.
قد يتساءل بعض الأشخاص الذين ليسوا على دراية بها لماذا يجب علينا دراسة شبكات GAN عندما يكون هناك بالفعل العديد من طرق التعلم الآلي الناضجة؟
في الواقع، حققت شبكات GAN نتائج تفوقت على طرق التعرف والتصنيف البسيطة، والتي تولد مخرجات بناءً على المراجع أو العينات، وكانت النتائج غير عادية.
وظيفيًا، تتشابه شبكات GAN إلى حد كبير مع الشبكات العصبية التلافيفية الأخرى. إن الحساب الأساسي للمميز في شبكة GAN يشبه تصنيف الصور الأساسي، في حين أن المولد يشبه الشبكة العصبية التلافيفية التي تنتج المحتوى.

تتكون شبكات GAN من شبكتين للتعلم العميق: شبكة المولد وشبكة التمييز، وهما مفهومان موجودان بالفعل في التعلم الآلي، لكنهما يعملان معًا بطريقة جديدة، وهذا هو أيضًا ما يميز شبكات GAN.
عند العمل بالرسومات، يأخذ المولد مجموعة بيانات ويحاول تحويلها إلى صورة، على سبيل المثال، يقوم بتوليف صورة من البيانات ثم يمررها إلى المميز، والذي يتخذ قرارًا بالتمييز بين ما إذا كانت الصورة "حقيقية" أو "مزيفة".
يتعلم المولد نقاط ضعف المميز من خلال ردود أفعاله، ويحقق الاثنان نتائج أفضل في اللعبة بينهما. ومع ذلك، فإن هذا النهج يجعل الحسابات المطلوبة للتدريب أكثر تعقيدًا ويواجه أيضًا بعض الصعوبات الجديدة.
الصعوبات مع شبكات GAN
تتمتع شبكات GAN بأداء مثير للإعجاب، ولكن ليس من السهل استغلالها بالكامل. على سبيل المثال، قد تواجه انهيار الوضع، مما سيؤدي إلى عدم الاستقرار في عملية التدريب وردود الفعل.
هناك مشكلة شائعة أخرى وهي أن إحدى الشبكات في المواجهة تطغى على الأخرى. على سبيل المثال، يقوم المولد بإنتاج صور لا يستطيع المميز التمييز بينها. في هذه الحالة، لا يتمكن المولد من الحصول على ردود فعل جيدة ولا يتمكن من التعلم بشكل فعال.
لحسن الحظ، يمكن معالجة مشكلة مكافحة الخلل في الوقت المناسب، ولكن المتطلبات العالية للأجهزة ليست سهلة التعامل معها.
يتطلب تدريب شبكة عصبية بسيطة قدرًا معينًا من قوة الحوسبة، لذا فإن شبكات GAN تضع ضغطًا على النظام، وخاصة متطلبات الذاكرة.
من الصعب إكمال هذا النوع من العمل على جهاز يحتوي على وحدة معالجة مركزية فقط، ولاستخدام وحدة معالجة الرسوميات، يتعين علينا مواجهة مشكلة الموارد المحدودة في الواقع.

قال برايان كاتانزارو، نائب رئيس قسم التعلم الآلي التطبيقي في شركة إنفيديا: "تتطلب شبكات GAN المزيد من قوة الحوسبة، والبنية الأساسية تلحق بالركب". "تحتاج إلى مزيد من إنتاجية البيانات عند استخدام شبكات GAN لأن هذه النماذج يمكن أن تكون كبيرة جدًا وتحتوي على العديد من المعلمات، لذا يتطلب التدريب قدرًا كبيرًا من قوة الحوسبة والذاكرة."
"تقتصر ذاكرة العديد من شبكات GAN التي ندربها على الذاكرة، وحتى نماذج التدريب ذات حجم دفعة واحد أو اثنين سوف تملأ ذاكرة وحدة معالجة الرسوميات بالكامل لأن النماذج عادة ما تكون كبيرة الحجم."
تحتاج شبكات GAN الجيدة إلى سروج جيدة
وأضاف كاتانزارو: "إن بناء نظام أكبر قد يكون مفيدًا أثناء التدريب، ومن المفيد أيضًا تقسيم الدفعات عبر وحدات معالجة رسومية متعددة. لكن هذا يتطلب وصلة قوية تركز على وحدة معالجة الرسوميات، مثل NVlink، المستخدمة في شبكات GAN للفيديو على DGX-1."
وفي هذا الصدد، يوضح عملهم على إنشاء مقاطع فيديو تفاعلية للألعاب الأداء الممتاز لشبكات GAN، والتي يمكنها إنشاء بيئات ديناميكيًا في الوقت الفعلي تقريبًا.
كما ذكر DGX-2، "بمجرد أن يصبح جاهزًا، فسوف يعمل على تسريع عملنا".

بالنسبة لعمل Nvidia على تركيب الفيديو باستخدام شبكات GAN، فإن مشكلة تشغيل النماذج الكبيرة على وحدات معالجة الرسومات بارزة بشكل خاص.
"نحن نهتم بمشاكل الرسومات ونهتم باستخدامها لإنشاء ألعاب الفيديو كطريقة أفضل لإنشاء المحتوى، حيث يمكنك بسهولة إنشاء عوالم افتراضية من خلال التدريب على مقاطع فيديو من العالم الحقيقي."
لكن هذه العملية معقدة أيضًا، خاصةً في شبكات GAN للفيديو، لأنها لا تقتصر على توليد الصورة الحالية فحسب، بل أيضًا سلسلة من الصور المرتبطة بها. وهذا يتطلب ذاكرةً وأداءً حاسوبيًا أفضل.
على سبيل المثال، تحدثنا مؤخرًا عن إمكانات شبكات GAN في اكتشاف الأدوية. وتبين أنه بالإضافة إلى الشبكة التنافسية، كانت هناك حاجة أيضًا إلى مكونات التعلم المعزز وردود الفعل التمييزية، مما أدى إلى زيادة متطلبات البنية التحتية.
حققت شركة الأدوية الناشئة Insilico Medicine بعض النجاح باستخدام مجموعات وحدات معالجة الرسوميات عالية الأداء لتكييف نماذجها في النظام، ولكن للمضي قدمًا، لا تزال بحاجة إلى المزيد من قوة الحوسبة، والمزيد من الذاكرة، ونطاق ترددي أفضل للذاكرة.
مستقبل شبكات GAN
وقال كاتانزارو: "يمكن استخدام شبكات GAN من أي حجم في السياقات الأكاديمية أو التقنية أو المؤسسية خارج نطاق توليد الصور والفيديو، ولكن هناك حاجة إلى معالجة قيود الأجهزة والبرامج قبل أن تصبح حالات الاستخدام واسعة النطاق ممكنة، وهذا لا يزال في الأيام الأولى".
"كانت هناك محاولات لاستخدام شبكات GAN في مجالات أخرى، مثل تطبيقات النصوص والصوت، ولكن النتائج لم تكن جيدة كما كانت الحال بالنسبة للصور ومقاطع الفيديو."
وهذا يوضح فقط أنه من الصعب إثبات ما ينجح قبل تجربته.
وأضاف كاتانزارو: "لقد حققت شبكات GAN نجاحًا كبيرًا في مجال الرؤية حتى الآن، وهذا هو السبب في أنها اكتسبت اليد العليا في التصوير الطبي".

وفي حين يُؤمل أن تتمكن المزيد من الشركات من استكشاف مجموعة واسعة من مجالات التطبيق خارج نطاق الصور ومقاطع الفيديو في الألعاب أو إنشاء المحتوى، فإن كلا جانبي هذه المنصة يحتاجان إلى ظروف أكثر نضجًا.
يبدو أن هناك أفكارًا وتطورات جديدة في أبحاث شبكات GAN كل يوم، ولكن الافتقار إلى التطبيقات التي يمكن تشغيلها بكفاءة على الأجهزة يخلق وضعًا غير مرغوب فيه.
ومع ذلك، وكما يمكن أن نرى من خلال تطوير الذكاء الاصطناعي، فإن التحسين والتعديل المستمر قد يجلبان تقنيات بعيدة إلى مجال رؤيتنا على المدى القصير.
حان الوقت للانتقال إلى GAN
تتولى شركة Nvidia زمام بعض الأعمال الرائدة في مجال شبكات GAN نظرًا لكون وحدات معالجة الرسومات (GPU) هي منصة التدريب المهيمنة، وهي مهمة تدريب صعبة حتى مع أفضل أنظمة DGX الخاصة بها.
ليس من الصعب التنبؤ بأنه في مستقبل الرسوميات والألعاب، قد تقوم شركة Nvidia، بقدراتها القوية، بتغيير قواعد اللعبة.
ولكن مع رؤية وحدات معالجة الرسوميات تقفز من أجهزة الألعاب الاستهلاكية إلى مسرعات الطاقة لأجهزة الكمبيوتر العملاقة، ربما يمكننا أن نتعلم أنه لا ينبغي لنا الاستهانة بتكنولوجيا في مجال البحث لمجرد أنها تجلب تجربة ألعاب جيدة فقط.
وبشكل عام، في العام الجديد، بالإضافة إلى إنشاء الفيديو والصور، آمل أن أرى تطبيق شبكات GAN في المزيد من المجالات.
ولكن عند استخدام شبكات GAN، قد تحتاج إلى تجهيز نفسك ببيئة أجهزة كافية أولاً. حسنًا، دون مزيد من اللغط، دعنا ننتقل إلى GAN! حظ سعيد!
