تجارب التصوير الافتراضي تحسنت شفافية وأنظمة الذكاء الاصطناعي في تصوير كوفيد-19 وموثوقيتها

تمت مواجهة مصداقية نماذج الذكاء الاصطناعي (AI) في التصوير الطبي، خاصة خلال جائحة كوفيد-19، بقضايا تتعلق بالقابلية للتكرار والرؤى السريرية المبهمة. لمعالجة هذه المخاوف، نقترح إطارًا للتجارب التصويرية الافتراضية (VIT)، يستخدم مجموعة بيانات سريرية ومحاكاة لتقييم أنظمة الذكاء الاصطناعي. يركز هذا البحث على استخدام شبكات العصبونات المتلافهة (CNNs) لتشخيص كوفيد-19 باستخدام التصوير المقطعي المحوسب (CT) والتصوير الصدري الإشعاعي (CXR). قمنا بتطوير واختبار عدة نماذج للذكاء الاصطناعي، بما في ذلك هياكل مشابهة لـ 3D ResNet و 2D EfficientNetv2، عبر مجموعات بيانات متنوعة. شملت مقاييس تقييمنا المساحة تحت المنحنى (AUC). تم استخدام تحليلات إحصائية مثل طريقة ديلونغ لفواصل الثقة AUC لتقييم الاختلافات في الأداء. أظهرت نتائجنا أن VIT توفر منصة صلبة لتقييم موضوعي، وكشفت عن تأثيرات كبيرة لمميزات البيانات السريرية والعوامل المرتبطة بالمريض وفيزياء التصوير على فعالية الذكاء الاصطناعي. بشكل خاص، أظهرت النماذج التي تم تدريبها على أكثر مجموعات البيانات تنوعًا أفضل أداء في الاختبار الخارجي، حيث بلغت قيم AUC من 0.73 إلى 0.76 للتصوير المقطعي المحوسب (CT) ومن 0.70 إلى 0.73 للتصوير الصدري الإشعاعي (CXR). أدّى الاختبار الداخلي إلى الحصول على قيم AUC أعلى (من 0.77 إلى 0.85 للتصوير المقطعي المحوسب CT ومن 0.77 إلى 1.0 للتصوير الصدري الإشعاعي CXR)، مما يؤكد انخفاضًا كبيرًا في الأداء أثناء التحقق الخارجي، مما يبرهن على أهمية وجود بيانات تدريب واختبار متنوعة وشاملة. يعزز هذا النهج الشفافية والموثوقية للنموذج، ويقدم رؤى دقيقة حول العوامل التي تقود أداء الذكاء الاصطناعي ويقلص الفجوة بين البيئات التجريبية والسريرية. يؤكد البحث على إمكانات VIT في تحسين القابلية للتكرار والصلة السريرية لأنظمة الذكاء الاصطناعي في التصوير الطبي.