تقييم أداء StyleGAN2-ADA على الصور الطبية

على الرغم من الإمكانات التي أظهرتها الشبكات التوليدية التنافسية (GANs) في التصوير الطبي، إلا أنها تواجه أربع قيود رئيسية تحد من فعاليتها: التكلفة الحسابية، احتياجات البيانات، مقاييس التقييم الموثوقة، وتعقيد التدريب. تبحث دراستنا في كل واحدة من هذه العقبات من خلال تطبيق جديد لشبكة StyleGAN2-ADA على مجموعات بيانات تصوير طبي عالي الدقة. تتكون مجموعتنا من مقاطع عرضية تحتوي على الكبد من فحوصات التصوير المقطعي المحوسب (CT) غير المُضافة والمضافة بالصبغة. بالإضافة إلى ذلك، استخدمنا أربع مجموعات بيانات عامة مكوّنة من أنواع مختلفة من الوسائط التصويرية. تم تدريب شبكة StyleGAN2 باستخدام التعلم المنقول (من مجموعة بيانات Flickr-Faces-HQ) وتوسيع البيانات (الانعكاس الأفقي وتوسيع المُصنف التكيفي). وتم قياس جودة التوليد الكمي باستخدام مسافة فريشيت إينسيبشن (FID)، وقياس الجودة النوعية من خلال اختبار تورينغ البصري الذي أُعطي لسبعة أطباء أشعة وأطباء أورام إشعاعية.أظهرت شبكة StyleGAN2-ADA نتيجة FID قدرها 5.22 (± 0.17) على مجموعة بيانات التصوير المقطعي للكبد، كما سجلت أرقامًا قياسية جديدة في FID قدرها 10.78 و3.52 و21.17 و5.39 على المجموعات العامة SLIVER07 وChestX-ray14 وACDC وMedical Segmentation Decathlon (الأورام الدماغية) على التوالي. وفي اختبار تورينغ البصري، قُدّر الأطباء الصور المولدة بأنها حقيقية بنسبة 42% من الوقت، ما يقترب من التخمين العشوائي. كشفت دراسة التحليل الحسابي أن التعلم المنقول وتوسيع البيانات يُثبّتان عملية التدريب ويعززان الجودة الإدراكية للصور المولدة. ولاحظنا أن قياس FID يتماشى بشكل متسق مع التقييم البشري للصور الطبية من حيث الإدراك. وأخيرًا، وجدت دراستنا أن StyleGAN2-ADA تُنتج نتائج عالية الجودة باستمرار دون الحاجة إلى بحث عن المعايير المثلى أو إعادة التدريب.