استخدام تحسين البيانات السياقية للكشف عن الميلانوما بطرق قابلة للتعميم

بينما كان اكتشاف سرطان الجلد تطبيقًا قيمًا للتعلم العميق لسنوات، غالبًا ما تم تجاهل السياق الذي يتم فيه تقييم صور الاختبار. يفترض المصنفات التقليدية للسُّمْرَة (الحَبْش) أن بيئات اختبارها مماثلة للصور المنظمة التي تم تدريبها عليها. تحدي هذا الافتراض وترى هذه الورقة أن حجم الحَبْش، وهو خاصية حاسمة في علم الأمراض الجلدية المهني، يمكن أن يكون مضللًا في اكتشاف السُّمْرَة الخبيثة بشكل آلي. بينما تكون السُّمْرَات الخبيثة عادةً أكبر من السُّمْرَات الحميدة، فإن الاعتماد فقط على الحجم قد يكون غير موثوق به وحتى ضار عندما لا يمكن تناسب صور الاختبار مع السياق الفعلي. لمعالجة هذه المشكلة، تقترح هذه التنفيذية نموذجًا مخصصًا يقوم بإجراء إجراءات مختلفة لتقوية البيانات (Data Augmentation) لمنع التكيف الزائد على المعلمات الخاطئة ومحاكاة الاستخدام الفعلي لتطبيقات اكتشاف السُّمْرَة الخبيثة. يتم تنفيذ العديد من النماذج المخصصة التي تعتمد على أشكال مختلفة من تقوية البيانات لإبراز أهم الخصائص للمصنفات الحَبْش. تؤكد هذه التنفيذيات على أهمية مراعاة عدم قابلية التنبؤ بالمستخدم عند نشر مثل هذه التطبيقات. يتم الإقرار بالحذر المطلوب عند تعديل البيانات يدويًا، حيث يمكن أن يؤدي ذلك إلى فقدان البيانات واستنتاجات متحيزة. بالإضافة إلى ذلك، يتم النظر في أهمية تقوية البيانات في كلٍ من مجتمع علم الأمراض الجلدية ومجتمع التعلم العميق.