HyperAIHyperAI
منذ 11 أيام

التسجيل المكاني للصور المتماسك مع مُدخلات نصية

Xiang Chen, Min Liu, Rongguang Wang, Renjiu Hu, Dongdong Liu, Gaolei Li, Hang Zhang
التسجيل المكاني للصور المتماسك مع مُدخلات نصية
الملخص

تُعد الصور الطبية غالبًا ما تتميز بتمثيلات تشريحية منظمة وتناقضات فضائية غير متجانسة. ويمكن لاستغلال المعرفة التشريحية السابقة (anatomical priors) في الشبكات العصبية أن يُعزز بشكل كبير من فعاليتها في البيئات السريرية المحدودة الموارد. وقد استخدمت الأبحاث السابقة هذه المعلومات لتقسيم الصور، إلا أن التقدم في مجال التسجيل الصوري المرن (deformable image registration) كان محدودًا. ويقدم عملنا منهجًا جديدًا يُسمى textSCF، والذي يُدمج بين مرشحات متميزة فضائيًا (spatially covariant filters) وتعليقات تشريحية نصية مشفرة باستخدام نماذج اللغة والصورة (visual-language models)، بهدف سد هذه الفجوة. ويُحسّن هذا النهج دالة ضمنية تربط بين مُدمجات النصوص (text embeddings) للمناطق التشريحية وأوزان المرشحات، مما يُخفّف من القيود التقليدية للاستقلال عن الترجمة (translation-invariance) في العمليات التلافيفية (convolutional operations). ويُعزز textSCF ليس فقط الكفاءة الحسابية، بل يمكنه أيضًا الحفاظ على دقة التسجيل أو حتى تحسينها. وبفضل قدرته على التقاط التفاعل السياقي بين المناطق التشريحية، يُظهر أداءً متميزًا في نقل المعلومات بين المناطق، ويُبقي على التفرعات البنائية (structural discontinuities) أثناء عملية التسجيل. وقد تم اختبار أداء textSCF بشكل صارم على مهام تسجيل صور الدماغ بالرنين المغناطيسي بين الأفراد (inter-subject brain MRI) وصور الأشعة المقطعية للبطن (abdominal CT)، حيث تفوق النماذج الحالية الأفضل في مسابقة MICCAI Learn2Reg 2021، وتصدر قائمة التصنيف (leaderboard). وفي مهام التسجيل البطني، حقق النموذج الأكبر في textSCF تحسنًا بنسبة 11.3% في معامل دايسي (Dice score) مقارنة بالنموذج الثاني الأفضل، بينما حافظ النموذج الأصغر على دقة مشابهة لكن مع خفض بنسبة 89.13% في عدد معاملات الشبكة وانخفاض بنسبة 98.34% في العمليات الحسابية.

التسجيل المكاني للصور المتماسك مع مُدخلات نصية | أحدث الأوراق البحثية | HyperAI