HyperAIHyperAI
il y a 8 jours

Apprentissage robuste au bruit sensible aux échantillons difficiles pour la classification d'images d'histopathologie

Chuang Zhu, Wenkai Chen, Ting Peng, Ying Wang, Mulan Jin
Apprentissage robuste au bruit sensible aux échantillons difficiles pour la classification d'images d'histopathologie
Résumé

La classification d’images histopathologiques basée sur l’apprentissage profond constitue une technique clé pour aider les médecins à améliorer la précision et la rapidité du diagnostic du cancer. Toutefois, les étiquettes bruitées sont souvent inévitables dans le processus complexe d’annotation manuelle, ce qui peut induire en erreur l’entraînement du modèle de classification. Dans ce travail, nous proposons une nouvelle méthode d’apprentissage robuste au bruit, sensible aux échantillons difficiles, pour la classification d’images histopathologiques. Pour distinguer les échantillons informatifs difficiles des échantillons nuisibles contaminés par le bruit, nous avons conçu un modèle de détection facile/difficile/bruité (EHN) fondé sur l’historique d’entraînement des échantillons. Nous intégrons ensuite ce modèle EHN dans une architecture d’auto-entraînement afin de réduire progressivement le taux de bruit grâce à une correction itérative des étiquettes. À partir de l’ensemble de données presque propre ainsi obtenu, nous proposons également une stratégie de suppression du bruit et d’amélioration des échantillons difficiles (NSHE) pour entraîner un modèle robuste au bruit. Contrairement aux approches précédentes, notre méthode permet de préserver davantage d’échantillons propres et peut être directement appliquée à des scénarios réels impliquant des jeux de données bruités, sans nécessiter de sous-ensemble propre. Les résultats expérimentaux montrent que la méthode proposée surpassent les états de l’art actuels sur des jeux de données bruités synthétiques et réels. Le code source et les données sont disponibles à l’adresse suivante : https://github.com/bupt-ai-cz/HSA-NRL/.