CorGAN: شبكات توليدية معارضة تلافيفية تُمكّن من التقاط الارتباطات لتوليد سجلات رعاية صحية اصطناعية

أظهرت نماذج التعلم العميق أداءً عالي الجودة في مجالات مثل تصنيف الصور ومعالجة الصوت. ومع ذلك، يتطلب إنشاء نموذج تعلم عميق باستخدام بيانات السجلات الصحية الإلكترونية (EHR) معالجة تحديات خاصة تتعلق بالخصوصية، وهي تحديات فريدة تواجه الباحثين في هذا المجال. ويُوجّه هذا الأمر الانتباه إلى إنشاء بيانات اصطناعية واقعية مع ضمان الخصوصية. في هذه الورقة، نقترح إطارًا جديدًا يُسمى الشبكة التوليدية المتنافسة التي تُمكّن من التقاط الارتباطات (CorGAN)، لتصنيع سجلات صحية اصطناعية. في إطار CorGAN، نستخدم الشبكات العصبية التلافيفية (Convolutional Neural Networks) لالتقاط الارتباطات بين السمات الطبية المجاورة في فضاء تمثيل البيانات، وذلك من خلال دمج الشبكات التوليدية المتنافسة التلافيفية (Convolutional Generative Adversarial Networks) مع مُشَكِّلات التشفير التلافيفية (Convolutional Autoencoders). ولإثبات واقعية النموذج، نُظهر أن CorGAN تُنتج بيانات اصطناعية تُحقق أداءً مشابهًا للأداء المُحقَّق بالبيانات الحقيقية في مختلف بيئات التعلم الآلي، مثل التصنيف والتنبؤ. كما نقدّم تقييمًا للخصوصية ونُقدّم تحليلات إحصائية تتعلق بخصائص البيانات الاصطناعية الواقعية. ويُعدّ البرنامج البرمجي الخاص بهذه الدراسة مفتوح المصدر، ويمكن الوصول إليه عبر الرابط التالي: https://github.com/astorfi/cor-gan.