تحسين دقة الصور الطبية الرمزية باستخدام شبكة انتباه الاستدلال المضغوط والتحفيزي

تُوفر صور الرنين المغناطيسي عالية الجودة والدقة العالية (HR) معلومات أكثر تفصيلاً لتمكين التشخيص الموثوق وتحليلات الصور الكمية. وقد أظهرت الشبكات العصبية العميقة ذات التحويلات التلافيفية (CNN) قدرة واعدة على تحسين دقة صور الرنين المغناطيسي (SR) عند توفر صور منخفضة الدقة (LR). عادةً ما تتمتّع صور الرنين المغناطيسي منخفضة الدقة بخصائص بصرية مشتركة، مثل الأنماط المتكررة، والهياكل النسبية البسيطة، والخلفيات الأقل إفادةً بالمعلومات. ومعظم الطرق السابقة القائمة على الشبكات العصبية العميقة لتحسين الدقة تعامل جميع البكسلات المكانية (بما في ذلك الخلفية) بشكل متساوٍ، كما أنها تفشل في استشعار الفضاء الكامل للإدخال، وهو أمر بالغ الأهمية لتحسين دقة صور الرنين المغناطيسي عالية الجودة. ولحل هذه المشكلات، نقترح شبكة تسمى "الشبكة المُنتَجة للانتباه والاستدلال المُضاعف" (SERAN) لتحسين دقة صور الرنين المغناطيسي بدقة عالية. نقترح استخلاص انتباه مركّز من المعلومات المكانية الشاملة للإدخال، والحصول على وصفات عالمية (global descriptors). وتساهم هذه الوصفات العالمية في تعزيز قدرة الشبكة على التركيز على المناطق والهياكل الأكثر إفادةً في صور الرنين المغناطيسي. ونقوم ببناء علاقات بين هذه الوصفات العالمية، ونقترح آلية استدلال انتباهية أولية (primitive relationship reasoning attention). كما نُعدّل هذه الوصفات العالمية بشكل مُحسّن باستخدام الانتباه المُتعلم. وللاستفادة الكاملة من المعلومات المجمعة، نُعدّل استجابة الميزات بشكل تكيفي باستخدام متجهات انتباه تكيفية مُستَمَدة من التعلّم. وتُختار هذه المتجهات انتقائيًا مجموعة من الوصفات العالمية لتعويض كل موقع مكاني، مما يُسهم في إعادة بناء التفاصيل والأنسجة بدقة عالية. كما نقترح آلية انتباه مُضاعفة مع مقياس تكاملي (residual scaling)، التي لا تُحسّن فقط استقرار التدريب، بل تجعل الشبكة مرنة عند دمجها مع الشبكات الأساسية الأخرى. وتشير التجارب الواسعة إلى فعالية الشبكة المقترحة SERAN، التي تتفوّق بشكل واضح على أحدث الطرق في المعايير المعيارية من حيث الجودة الكمية والكيفية.