طرق مُعدِّل التسمية الاقتصادية: التصنيف الدلالي متعدد الفئات على التسميات غير الموحدة

يُسهم التعلم العميق بشكل متزايد في تسريع الأبحاث الطبية الحيوية، من خلال استخدام الشبكات العصبية لأداء مهام متعددة مثل تصنيف الصور، وكشف الكائنات، والتقسيم الدلالي. ومع ذلك، تُدرَّب الشبكات العصبية عادةً بطريقة مراقبة على مجموعات بيانات كبيرة ومُوسومة. وتُشكّل هذه الشروط المسبقة تحديات في مجال تمييز الصور الطبية الحيوية، نظرًا لأن مجموعات البيانات غالبًا ما تكون صغيرة الحجم، وصعبة الحصول عليها، ومرتفعة التكلفة في التسمية، وغالبًا ما تكون مُوسومة بشكل غير متجانس. علاوةً على ذلك، تُعد التسميات غير المتجانسة تحديًا للأساليب المراقبة. فإذا لم تُسَمَّ جميع الفئات لعينة فردية، فإن النماذج العصبية المُدرَّبة بطريقة مراقبة يمكنها فقط التعلُّم على مجموعة جزئية من البيانات تحتوي على التسميات المشتركة لكل عينة فردية؛ وبالتالي، يُصبح على مهندسي تمييز الصور الطبية الحيوية أن يكونوا حذرين جدًا في استخدام التسميات والحقائق الحقيقية (ground truth). يناقش هذا البحث تأثير التسمية المُقتَصِدة، ويوصي بتدريب الشبكات العصبية على التقسيم الدلالي متعدد الفئات على بيانات مُوسومة بشكل غير متجانس، باستخدام دالة هدف جديدة. وتُدمج دالة الهدف هذه بين خسارة غير متماثلة حسب الفئة وخسارة دايس (Dice loss). ويُظهَر الأداء من خلال تدريب على حقائق حقيقية نادرة في مجموعة بيانات مُوسومة بشكل غير متجانس، والتدرُّب ضمن إطار التعلم الناقل (transfer learning)، واستخدام مثال عملي يشمل دمج عدة مجموعات بيانات مُوسومة بشكل غير متجانس. ولتحقيق ذلك، تُستخدم مجموعة بيانات صغيرة الحجم، متعددة الفئات، للتقسيم الدلالي في المجال الطبي الحيوية. وتُبنى مجموعة بيانات heartSeg على أساس نموذج القلب في سمكة المِدَّة (medaka fish). ويُعدّ أتمتة تمييز الصور والتقسيم الدلالي أمراً ضرورياً لتمكين التجارب عالية الإنتاجية، وهو أمر حاسم في الأبحاث الطبية الحيوية. وتشير نتائج منهجنا وتحليلنا إلى نتائج تنافسية في السياقات المُراقبة، وتشجع على استخدام التسمية المُقتَصِدة في مجال تمييز الصور الطبية الحيوية.