G-CASCADE: فك رموز متسلسل للرسوم البيانية لتقسيم الصور الطبية ثنائية الأبعاد بكفاءة

في السنوات الأخيرة، أصبحت تقسيم الصور الطبية إلى مناطق (segmentation) تطبيقًا مهمًا في مجال التشخيص المعاون بالحاسوب. في هذا البحث، نقترح لأول مرة مفكك جديد يعتمد على التحليل الشجري للدارات العصبية (graph convolution) يُسمى مفكك الانتباه التحليلي الشجري المتتابع (G-CASCADE)، لتقسيم الصور الطبية ثنائية الأبعاد. يعمل G-CASCADE على تحسين الخرائط المميزة متعددة المراحل التي تنتجها الكودرات التحويلية الهرمية باستخدام كتلة دارات عصبية شجرية فعالة. تعتمد الكودرة على آلية الانتباه الذاتي (self-attention) لالتقاط الارتباطات البعيدة، بينما يقوم المفكك بتحسين الخرائط المميزة مع الحفاظ على المعلومات البعيدة بفضل حقول الاستقبال العالمية لكتلة الدارات العصبية الشجرية.أظهرت التقييمات الدقيقة لمفككنا مع عدة كودرات تحويلية أداءً أفضل لنموذجنا مقارنة بالطرق الرائدة الأخرى (SOTA) في خمسة مهام تقسيم صور طبية (أي، أعضاء البطن، أعضاء القلب، الآفات البوليبية، آفات الجلد، والأوعية الشبكية). كما أثبتنا أن مفككنا يحقق درجات DICE أعلى من مفكك CASCADE الرائد بنسبة 80.8% أقل من المعالم و82.3% أقل من العمليات العددية (FLOPs). يمكن استخدام مفككنا بسهولة مع كودرات هرمية أخرى للمهام العامة للتقسيم الدلالي والتقسيم الطبي للصور.