التشخيص التوجيهي للتشوهات في صور الأشعة الصدرية باستخدام مجموعة بيانات ضخمة مُولَّدة تلقائيًا
Geon Choi Hangyul Yoon Hyunju Shin Hyunki Park Sang Hoon Seo Eunho Yang Edward Choi

الملخص
تُحدَّد قابلية نماذج التجزئة الحالية للآفات في أشعة الصدر (CXR) بوجود عدد محدود من التصنيفات المستهدفة، وكذلك باعتمادها على مدخلات نصية متخصصة طويلة وتفصيلية، مما يُشكِّل عقبة أمام الاستخدام العملي. وللتغلب على هذه القيود، نُقدِّم نموذجًا جديدًا: التجزئة المُوجَّهة بالتعليمات (ILS)، المصمَّم لتمييز أنواع متعددة من الآفات استنادًا إلى تعليمات بسيطة وسهلة الاستخدام. ضمن هذا النموذج، نُنشئ MIMIC-ILS، وهي أول مجموعة بيانات كبيرة الحجم مُوجَّهة بالتعليمات والإجابة لتمييز الآفات في أشعة الصدر، باستخدام نهجنا التلقائي بالكامل متعدد الوسائط، الذي يُولِّد التصنيفات من صور أشعة الصدر وملخصات التقارير المرتبطة بها. تضم MIMIC-ILS 1.1 مليون زوج من التعليمات والإجابات المستمدة من 192 ألف صورة و91 ألف قناع تجزئة فريد، وتغطي سبعة أنواع رئيسية من الآفات. ولإثبات فعاليتها تجريبيًا، نُقدِّم ROSALIA، وهو نموذج رؤية-لغة تم تدريبه بدقة على MIMIC-ILS. يُمكن لـ ROSALIA تمييز أنواع متنوعة من الآفات وتقديم تفسيرات نصية استجابةً للتعليمات المقدمة من المستخدم. وتحقيق النموذج دقة عالية في التجزئة والنص في المهمة المُقدَّمة حديثًا، مما يُبرز فعالية نهجنا وقيمة MIMIC-ILS كمصدر أساسي لربط الآفات في أشعة الصدر على مستوى البكسل.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.