اقرأ، وشارك، ورمّز: دفع حدود التنبؤ بالرموز الطبية من الملاحظات السريرية بواسطة الآلات

تنبؤ الرموز الطبية من الملاحظات السريرية هو احتياجات عملية وضرورية لكل مؤسسة تقديم الرعاية الصحية في الأنظمة الطبية الحالية. تلقين التسميات آليًا سيوفر وقتًا وجهدًا كبيرين يُبذلان حاليًا بواسطة المصنفين البشريين. ومع ذلك، فإن التحدي الأكبر يتمثل في تحديد الرموز الطبية المناسبة مباشرة من بين آلاف الرموز ذات الأبعاد العالية من الملاحظات السريرية النصية غير المنظمة. خلال السنوات الثلاث الماضية، تم إحراز تقدم كبير في مواجهة أصعب معيار للمجموعة المرجعية MIMIC-III-full-label (MIMIC-III-العلامات الكاملة) للبيانات السريرية الدخولية. هذا التقدم يثير السؤال الأساسي حول مدى قرب أنظمة التعلم الآلي (ML) المُتَنَفِّذة آليًا من أداء المصنفين البشريين. قدمنا تقديرًا لأساس أداء المصنفين البشريين على نفس مجموعة الاختبار المستخرجة عشوائيًا. كما نقدم نموذجنا "قراءة، الانتباه، والترميز" (RAC) لتعلم خرائط تعيين الرموز الطبية. من خلال ربط التضمينات المحولة بالانتباه الذاتي ووحدات الانتباه التي تُرشد بعناوين الرموز، مع استخدام تحسين البيانات القائم على إعادة ترتيب الجمل والتدريب بمتوسط الوزن العشوائي، يحدد النموذج RAC حالة جديدة فائقة (SOTA)، ويتفوق بشكل كبير على أفضل Macro-F1 الحالي بنسبة 18.7%، ويتجاوز أساس أداء الترميز البشري. يمثل هذا الإنجاز الجديد خطوة ذات معنى نحو الترميز الطبي المستقل تمامًا (AMC) حيث تصل الآلات إلى مستوى مساوٍ لأداء المصنفين البشريين في تنبؤ الرموز الطبية.