ParaTransCNN: مشغل TransCNN متوازٍ لتقسيم الصور الطبية

أصبحت الطرق القائمة على الشبكات العصبية التلافيفية شائعة بشكل متزايد في تقسيم الصور الطبية بفضل أدائها المتميز. ومع ذلك، تواجه صعوبة في التقاط الاعتماديات على المدى الطويل، وهي ضرورية لتمثيل دقيق للارتباطات السياقية العالمية. وبفضل قدرتها على نمذجة الاعتماديات الطويلة المدى من خلال توسيع مجال الاستقبال، اكتسبت الطرق القائمة على المُحَوِّل (Transformer) مكانة بارزة. مستوحى من هذا، نقترح طريقة متقدمة لاستخراج الميزات ثنائية الأبعاد من خلال دمج هندستي الشبكة العصبية التلافيفية والمحوّل (Transformer). وبشكل أكثر تحديدًا، نُقدِّم بنية مشفرة متوازية، حيث تستخدم أحد الفروع شبكة ResNet لاستخراج المعلومات المحلية من الصور، بينما تستخدم الفرع الآخر المحول (Transformer) لاستخراج المعلومات العالمية. علاوةً على ذلك، ندمج هياكل هرمية في المحول (Transformer) لاستخراج المعلومات العالمية بدرجات مختلفة من الدقة، وخاصة في المهام التي تتطلب تنبؤات مكثفة. ولتمكين الاستخدام الفعّال للمعلومات المختلفة في بنية المشفرة المتوازية خلال مرحلة فك التشفير، نستخدم وحدة انتباه القنوات لدمج ميزات المشفرة ونقلها عبر اتصالات مُمرّة (skip connections) وضيقات (bottlenecks). أُجريت تجارب عددية مكثفة على مجموعات بيانات تتضمن شجرة الأوعية الدموية الأبهرية، والقلب، والأعضاء المتعددة. وعند مقارنة أداء طريقتنا مع أحدث الطرق في تقسيم الصور الطبية، أظهرت النتائج تفوقًا في دقة التقسيم، خاصةً في الأعضاء الصغيرة. وتم إتاحة الشفرة المصدرية بشكل عام عبر الرابط: https://github.com/HongkunSun/ParaTransCNN.