Classification des sons pulmonaires à l’aide du co-tuning et de la normalisation stochastique

Dans cet article, nous utilisons des modèles ResNet pré-entraînés comme architectures principales pour la classification des sons pulmonaires anormaux et des maladies respiratoires. Les connaissances du modèle pré-entraîné sont transférées à l’aide de la fine-tuning classique, du co-tuning, de la normalisation stochastique, ainsi que de la combinaison des techniques de co-tuning et de normalisation stochastique. En outre, une augmentation de données est appliquée tant dans le domaine temporel que dans le domaine temps-fréquence afin de tenir compte de l’imbalanced des classes présentes dans les jeux de données ICBHI et notre jeu de données multi-canaux de sons pulmonaires. Par ailleurs, nous appliquons une correction spectrale pour prendre en compte les variations des caractéristiques des appareils d’enregistrement sur le jeu de données ICBHI. Expérimentalement, les systèmes proposés surpassent la plupart des méthodes de classification d’ sons pulmonaires de pointe pour les sons anormaux et les maladies respiratoires sur les deux jeux de données.