LHU-Net: شبكة U-مُختَلِطة خفيفة للتصنيف الحجمي للصور الطبية عالي الأداء وذو كلفة منخفضة

شهدت الزيادة في استخدام هياكل Transformer ثورة في مجال تجزئة الصور الطبية، مما أدى إلى ظهور نماذج هجينة تجمع بين الشبكات العصبية التلافيفية (CNNs) وTransformers لتحسين الدقة. ومع ذلك، غالبًا ما تعاني هذه النماذج من تعقيد متزايد، وتتجاهل التفاعل بين الميزات المكانية والميزات القنوية، وهي عناصر حيوية لتحقيق دقة عالية في التجزئة. نقدم نموذج LHU-Net، وهو نموذج هجين مبسط من نوع U-Net مخصص لتقطيع الصور الطبية ثلاثية الأبعاد، صُمّم لتحليل الميزات المكانية أولًا، ثم الميزات القنوية، بهدف استخلاص الميزات بشكل فعّال. تم اختبار LHU-Net على خمسة مجموعات بيانات معيارية (Synapse، LA، Pancreas، ACDC، BRaTS 2018)، وأظهر أداءً متميزًا من حيث الكفاءة والدقة، حيث حقق مقياس دايس البالغ 92.66 على مجموعة ACDC، مع استخدام 85٪ أقل من عدد المعلمات، وربع الحمل الحسابي مقارنة بالنماذج الرائدة. وقد تم تحقيق هذا الأداء دون الحاجة إلى تدريب مسبق، أو بيانات إضافية، أو تجميع نماذج (model ensembles)، ما يُشكّل معايير جديدة في الكفاءة الحسابية والدقة في التجزئة، باستخدام أقل من 11 مليون معلمة. يُبرز هذا الإنجاز إمكانية تحقيق توازن فعّال بين الكفاءة الحسابية والدقة العالية في تجزئة الصور الطبية. ويجدر الإشارة إلى أن نسخة LHU-Net مفتوحة المصدر، ويمكن للمجتمع البحثي الوصول إليها مجانًا على منصة GitHub عبر الرابط التالي: https://github.com/xmindflow/LHUNet.