UCTransNet: إعادة النظر في الاتصالات القفزية في U-Net من منظور قنوات البيانات باستخدام الشبكة المتحولة (Transformer)

معظم الطرق الحديثة للتقسيم الدلالي تتبني إطار U-Net ذو الهندسة المُشفر-المُفكك (الإنكودر-الديكودر). لا يزال من الصعب لـ U-Net مع مخطط اتصالات القفز البسيط نمذجة السياق متعدد المقاييس عالميًا: 1) ليست كل إعدادات اتصالات القفز فعّالة بسبب مشكلة عدم توافق مجموعات الخصائص في مرحلتي التشفير والتفكيش، وحتى بعض اتصالات القفز قد تؤثر سلبًا على أداء التقسيم؛ 2) الأصلية U-Net تكون أسوأ من تلك التي ليس لديها أي اتصال قفز على بعض المجموعات البيانات. بناءً على نتائجنا، نقترح إطار تقسيم جديد يُسمى UCTransNet (مع وحدة CTrans مقترحة في U-Net)، من وجهة نظر القنوات مع آلية الانتباه. بصفة خاصة، وحدة CTrans هي بديل لاتصالات القفز في U-Net، والتي تتكون من وحدة فرعية تقوم بالدمج متعدد المقاييس عبر القنوات باستخدام Transformer (وتُسمى CCT) ووحدة فرعية أخرى للانتباه عبر القنوات (وتُسمى CCA) لتوجيه المعلومات المتداخلة متعددة المقاييس عبر القنوات للتواصل الفعال مع خصائص المُفكك وإزالة الغموض. وبالتالي، يمكن للاتصال المقترح الذي يتكون من CCT وCCA أن يحل محل الاتصال الأصلي بالقفز لحل الثغرات الدلالية لتحقيق تقسيم دقيق تلقائي للصور الطبية. تشير النتائج التجريبية إلى أن UCTransNet الخاص بنا ينتج أداءً أكثر دقة في التقسيم ويحقق تحسينات مستمرة على أفضل ما تم الوصول إليه حتى الآن في التقسيم الدلالي عبر مجموعات بيانات مختلفة والهندسات التقليدية التي تتضمن Transformer أو الإطار ذي الشكل U.رمز المصدر: https://github.com/McGregorWwww/UCTransNet.