HyperAIHyperAI
منذ 9 أيام

تصنيف الأمراض الصدرية ذات التوزيع الطويل الذيل على الأشعة السينية للصدر: دراسة معيارية جديدة

Gregory Holste, Song Wang, Ziyu Jiang, Thomas C. Shen, George Shih, Ronald M. Summers, Yifan Peng, Zhangyang Wang
تصنيف الأمراض الصدرية ذات التوزيع الطويل الذيل على الأشعة السينية للصدر: دراسة معيارية جديدة
الملخص

تُنتج فحوصات التصوير، مثل الأشعة السينية للصدر، مجموعة صغيرة من النتائج الشائعة ومجموعة أكبر بكثير من النتائج النادرة. في حين يمكن لطبيب الأشعة المدرب أن يتعلم العرض البصري للحالات النادرة من خلال دراسة عدد قليل من الأمثلة التمثيلية، فإن تدريب الآلة على التعلم من توزيع "طويل الذيل" هذا أمر أكثر صعوبة بكثير، إذ تميل الطرق القياسية إلى التحيز بسهولة نحو الفئات الأكثر تكراراً. في هذه الورقة، نقدم دراسة مقارنة شاملة لمشكلة التعلم الطويلة الذيل في المجال المحدد للأمراض الصدرية على الأشعة السينية للصدر. ونركّز على التعلم من بيانات الأشعة السينية للصدر الموزعة بشكل طبيعي، مع تحسين دقة التصنيف ليس فقط بالنسبة للفئات الشائعة "الرأس"، بل أيضًا بالنسبة للفئات النادرة ولكنها حاسمة "الذيل". ولتحقيق ذلك، نقدّم معيارًا جديدًا صعبًا لبيانات الأشعة السينية للصدر ذات الذيل الطويل، بهدف دعم الأبحاث في تطوير طرق التعلم الطويلة الذيل للتصنيف الطبي للصور. يتكوّن هذا المعيار من مجموعتي بيانات لأشعة سينية للصدر، تُستخدم في تصنيف أمراض الصدر بـ 19 و20 فئة، وتضم فئات تتراوح أعداد الصور التدريبية المُصنّفة فيها بين 53,000 و7 صور فقط. قمنا بتقييم كل من الطرق القياسية والحديثة للغاية لتعلم الذيل الطويل على هذا المعيار الجديد، وتحليل الجوانب الأكثر فائدة في هذه الطرق بالنسبة للتصنيف الطبي للصور ذات التوزيع الطويل الذيل، مع تلخيص رؤى مفيدة لتصميم الخوارزميات المستقبلية. تتوفر مجموعات البيانات، والنموذج المدرب، والكود على الرابط: https://github.com/VITA-Group/LongTailCXR.

تصنيف الأمراض الصدرية ذات التوزيع الطويل الذيل على الأشعة السينية للصدر: دراسة معيارية جديدة | أحدث الأوراق البحثية | HyperAI