تowards understanding تصنيف نبضات القلب باستخدام الشبكات العصبية التلافيفية وخرائط الانتباه

أدى الوصول إلى بيانات السجلات الصحية الإلكترونية (EHR) إلى دفع التطورات الحاسوبية في البحث الطبي. ومع ذلك، فإن مخاوف متعددة، لا سيما المتعلقة بالخصوصية، قد تحد من إمكانية الوصول إلى بيانات EHR واستخدامها بالتعاون. ويمكن تقليل المخاطر من خلال مشاركة بيانات EHR الاصطناعية. في هذه الورقة، نقترح منهجية جديدة تُسمى الشبكة التوليدية التنافسية الطبية (medGAN) لتوليد سجلات مريض اصطناعية واقعية. وباستخدام السجلات الحقيقية للمريض كمدخلات، يمكن لـ medGAN توليد متغيرات متعددة الأبعاد من النوع المنفصل (مثل السمات الثنائية والعددية) من خلال دمج بين مُشفِّر تلقائي (autoencoder) والشبكات التوليدية التنافسية. كما نقترح تقنية المتوسط الجزئي (minibatch averaging) لتجنب توقف التعلم (mode collapse) بكفاءة، وزيادة كفاءة التعلم باستخدام التطبيع بالدُفعات (batch normalization) والاتصالات المباشرة (shortcut connections). ولإثبات الجدوى، أظهرنا أن medGAN تُولِّد سجلات مريض اصطناعية تحقق أداءً مماثلاً للبيانات الحقيقية في العديد من التجارب، بما في ذلك إحصائيات التوزيع، ومهام النمذجة التنبؤية، ومراجعة خبراء طبيين. كما لاحظنا تجريبيًا خطرًا محدودًا على الخصوصية، سواء فيما يتعلق بكشف الهوية أو الكشف عن الخصائص باستخدام medGAN.