HyperAIHyperAI
منذ 17 أيام

MedSegDiff-V2: التصنيف الطبّي للصورة المستند إلى التمايز مع Transformer

Junde Wu, Wei Ji, Huazhu Fu, Min Xu, Yueming Jin, Yanwu Xu
MedSegDiff-V2: التصنيف الطبّي للصورة المستند إلى التمايز مع Transformer
الملخص

حصل نموذج الانتشار الاحتمالي (DPM) على انتشار واسع في مجال رؤية الحاسوب مؤخرًا، بفضل تطبيقاته في توليد الصور، مثل Imagen ونماذج الانتشار المخفي (Latent Diffusion Models) وStable Diffusion، التي أظهرت قدرات مذهلة وشجعت على مناقشات واسعة داخل المجتمع العلمي. وقد كشفت الدراسات الحديثة عن الفائدة الكبيرة لنموذج DPM في مجال تحليل الصور الطبية، كما تُظهره الأداء المتميز لنموذج تجزئة الصور الطبية في مهام متعددة. وعلى الرغم من أن هذه النماذج كانت مبنية أصلاً على معمارية UNet، إلا أن هناك فرصة واعدة لتحسين أدائها من خلال دمج آليات نموذج الـ Vision Transformer. ومع ذلك، اكتشفنا أن دمج هاتين التقنيتين ببساطة يؤدي إلى أداء غير مرضٍ. ولإدماج هاتين التقنية المتطورة بشكل فعّال في مجال تجزئة الصور الطبية، نقترح إطارًا جديدًا يعتمد على الـ Transformer، يُدعى MedSegDiff-V2. وقد قمنا بتحقق فعالية هذا النموذج عبر 20 مهمة لتجزئة الصور الطبية، باستخدام مختلف أنواع الصور الطبية. ومن خلال تقييم شامل، أظهرت طريقة العمل لدينا تفوقًا ملحوظًا على الطرق المتطورة السابقة (SOTA). تم إصدار الشفرة المصدرية على الرابط: https://github.com/KidsWithTokens/MedSegDiff

MedSegDiff-V2: التصنيف الطبّي للصورة المستند إلى التمايز مع Transformer | أحدث الأوراق البحثية | HyperAI