تصنيف ICD من النص السريري باستخدام شبكة عصبية تلافيفية متعددة المرشحات مع بقاء

الترميز الآلي لـ ICD، والذي يقوم بتعيين رموز تصنيف الأمراض الدولي للزيارات الطبية للمرضى، جذب اهتمامًا كبيرًا في الأبحاث نظرًا لقدرته على توفير الوقت والجهد في الفواتير. استخدم النموذج السابق الرائد طبقة تجميعية واحدة لبناء تمثيلات المستندات بهدف التنبؤ برموز ICD. ومع ذلك، فإن أطوال وقواعد النصوص الجزئية، التي لها علاقة وثيقة بترميز ICD، تختلف بشكل كبير بين المستندات المختلفة. لذلك، قد لا يكون بنية التجميع المسطحة والثابتة الطول قادرة على تعلم تمثيلات مستندات جيدة. في هذا البحث، اقترحنا شبكة عصبية تجميعية متعددة المرشحات مع طبقة متبقيّة (MultiResCNN) لترميز ICD. تتضمن الابتكارات في نموذجنا جانبين: يستخدم طبقة تجميعية متعددة المرشحات لالتقاط أنماط نصية مختلفة بأطوال متفاوتة، واستخدام طبقة تجميعية متبقيّة لتوسيع المجال الاستقبالي. قمنا بتقييم فعالية نموذجنا على مجموعة البيانات الشائعة الاستخدام MIMIC. بالنسبة لمجموعة الرموز الكاملة في MIMIC-III، حقق نموذجنا أفضل النتائج من النموذج الرائد السابق في 4 من أصل 6 مقاييس التقييم. بالنسبة لمجموعة الرموز الخمسين الأولى في MIMIC-III ومجموعة الرموز الكاملة في MIMIC-II، حقق نموذجنا أفضل النتائج من جميع النماذج الموجودة والرائدة سابقًا في جميع مقاييس التقييم. يمكن الوصول إلى الكود عبر الرابط https://github.com/foxlf823/Multi-Filter-Residual-Convolutional-Neural-Network.