HyperAIHyperAI
il y a 7 jours

Rectification par transformation projective d’image à l’aide de données synthétiques pour la classification des radiographies thoraciques capturées par smartphone

Chak Fong Chong, Yapeng Wang, Benjamin Ng, Wuman Luo, Xu Yang
Rectification par transformation projective d’image à l’aide de données synthétiques pour la classification des radiographies thoraciques capturées par smartphone
Résumé

La classification des radiographies thoraciques (CXR) prises par smartphone afin de détecter des pathologies est un défi majeur en raison de la transformation projective induite par une position de caméra non idéale. Récemment, plusieurs méthodes de rectification ont été proposées pour diverses tâches de rectification d’images, telles que les photos de documents ou de plaques d'immatriculation. Toutefois, nous avons constaté qu’aucune de ces méthodes n’est adaptée aux images CXR, en raison de leur type de transformation spécifique, de leur apparence visuelle, de leur type d’annotation, etc. Dans cet article, nous proposons un nouveau réseau neuronal profond, nommé Projective Transformation Rectification Network (PTRN), conçu pour rectifier automatiquement les images CXR en prédiction du matrice de transformation projective. À notre connaissance, c’est le premier travail à considérer la prédiction de la matrice de transformation projective comme objectif d’apprentissage pour la rectification d’images. En outre, afin d’éviter la collecte coûteuse de données réelles, nous générons synthétiquement des images CXR en tenant compte de perturbations naturelles, de superpositions d’écrans supplémentaires, etc. Nous évaluons notre approche dans le cadre du concours de classification des images CXR prises par smartphone CheXphoto, organisé par le groupe de recherche en apprentissage automatique de l’Université Stanford. Notre méthode a obtenu la première place avec une amélioration significative des performances (notre score AUC : 0,850, contre 0,762 pour la deuxième meilleure méthode). Une analyse approfondie démontre que l’utilisation de PTRN permet d’atteindre un niveau de performance en classification sur les images CXR soumises à une transformation spatiale identique à celui obtenu sur des images CXR numériques de haute qualité, indiquant que PTRN élimine efficacement tous les effets négatifs de la transformation projective sur les images CXR.

Rectification par transformation projective d’image à l’aide de données synthétiques pour la classification des radiographies thoraciques capturées par smartphone | Articles de recherche récents | HyperAI