Interprétation des radiographies thoraciques à l’aide de CNN exploitant les dépendances hiérarchiques entre maladies et les étiquettes d’incertitude

La radiographie thoracique est l’un des examens de radiologie diagnostique les plus courants, essentielle au dépistage et au diagnostic de nombreuses maladies thoraciques. Des algorithmes spécialisés ont été développés pour détecter diverses pathologies spécifiques, telles que les nodules pulmonaires ou le cancer du poumon. Toutefois, la détection précise de la présence de plusieurs maladies à partir de radiographies thoraciques (CXR) reste un défi important. Ce papier présente un cadre supervisé de classification multi-label basé sur des réseaux de neurones convolutifs profonds (CNN) pour prédire le risque de 14 affections thoraciques courantes. Nous abordons ce problème en entraînant des CNN d’avant-garde exploitant les dépendances entre les étiquettes de pathologies. Nous proposons également d’utiliser la technique de lissage des étiquettes (label smoothing) afin d’améliorer la gestion des échantillons incertains, qui représentent une proportion significative de presque tous les jeux de données de CXR. Notre modèle est entraîné sur plus de 200 000 radiographies thoraciques issues du jeu de données récemment publié CheXpert, et atteint une moyenne de 0,940 pour l’aire sous la courbe ROC (AUC) dans la prédiction de 5 pathologies sélectionnées sur l’ensemble de validation. Ce score AUC est le plus élevé jamais rapporté à ce jour. La méthode proposée est également évaluée sur l’ensemble de test indépendant de la compétition CheXpert, composé de 500 études radiographiques annotées par un panel de 5 radiologues expérimentés. Les résultats sont en moyenne supérieurs à ceux de 2,6 sur 3 radiologues individuels, avec une AUC moyenne de 0,930, ce qui place notre méthode en première position au classement de la compétition CheXpert au moment de la rédaction de cet article.