HyperAIHyperAI
il y a 2 mois

Un Modèle d'Attention aux Étiquettes pour le Codage ICD à partir de Textes Cliniques

Thanh Vu; Dat Quoc Nguyen; Anthony Nguyen
Un Modèle d'Attention aux Étiquettes pour le Codage ICD à partir de Textes Cliniques
Résumé

Le codage ICD est un processus d'attribution de codes de diagnostic de la Classification internationale des maladies (CIM) aux notes cliniques/médicales rédigées par les professionnels de santé (par exemple, les cliniciens). Ce processus nécessite des ressources humaines importantes, ce qui le rend coûteux et sujet à des erreurs. Pour résoudre ce problème, l'apprentissage automatique a été utilisé pour le codage ICD automatique. Les modèles précédents de pointe étaient basés sur des réseaux neuronaux convolutifs, utilisant une ou plusieurs tailles de fenêtre fixes. Cependant, les longueurs et les interdépendances entre les fragments textuels liés aux codes ICD dans le texte clinique varient considérablement, ce qui complique la détermination des meilleures tailles de fenêtre. Dans cet article, nous proposons un nouveau modèle d'attention aux étiquettes pour le codage ICD automatique, capable de gérer à la fois les différentes longueurs et les interdépendances des fragments textuels liés aux codes ICD. De plus, comme la majorité des codes ICD ne sont pas fréquemment utilisés, entraînant un problème d'extrême déséquilibre des données, nous proposons également un mécanisme d'apprentissage conjoint hiérarchique qui étend notre modèle d'attention aux étiquettes pour gérer cette question en utilisant les relations hiérarchiques entre les codes. Notre modèle d'attention aux étiquettes obtient de nouveaux résultats de pointe sur trois ensembles de données de référence MIMIC, et le mécanisme d'apprentissage conjoint aide à améliorer les performances pour les codes peu fréquents.

Un Modèle d'Attention aux Étiquettes pour le Codage ICD à partir de Textes Cliniques | Articles de recherche récents | HyperAI