CycleGuardian : Un cadre pour la classification automatique des sons respiratoires basée sur le regroupement profond amélioré et l'apprentissage contrastif

L’auscultation joue un rôle fondamental dans le diagnostic précoce des maladies respiratoires et pulmonaires. Malgré l’émergence de méthodes basées sur l’apprentissage profond pour la classification automatique des sons respiratoires après la pandémie de Covid-19, la faiblesse des jeux de données disponibles limite l’amélioration des performances. La distinction entre sons respiratoires normaux et anormaux reste difficile en raison de la coexistence, dans les deux catégories, de composantes normales et de bruits parasites. Par ailleurs, les différents sons respiratoires anormaux présentent des caractéristiques anormales similaires, ce qui complique leur différenciation. En outre, les modèles d’état de l’art actuels souffrent d’une taille excessive de paramètres, ce qui entrave leur déploiement sur des plateformes mobiles à ressources limitées. Pour surmonter ces défis, nous proposons un réseau léger, CycleGuardian, ainsi qu’un cadre fondé sur un apprentissage par regroupement profond amélioré et un apprentissage contrastif. Nous générons tout d’abord un spectrogramme hybride afin d’assurer une diversité des caractéristiques, puis regroupons les spectrogrammes pour faciliter la détection des anomalies intermittentes. CycleGuardian intègre un module de regroupement profond associé à un composant de regroupement contraint par similarité, améliorant ainsi la capacité à capturer les caractéristiques anormales, ainsi qu’un module d’apprentissage contrastif avec mélange de groupes, renforçant la discrimination des caractéristiques anormales. L’optimisation multi-objectifs permet d’améliorer les performances globales durant l’entraînement. Dans nos expériences, en utilisant le jeu de données ICBHI2017 selon la méthode de partition officielle et sans recourir à des poids pré-entraînés, notre méthode atteint un taux de précision (Sp) de 82,06 %, une sensibilité (Se) de 44,47 % et un score global de 63,26 %, avec une taille de modèle de 38 M, surpassant ainsi les modèles actuels d’environ 7 %, ce qui représente les meilleures performances actuelles. En outre, nous avons déployé le réseau sur des appareils Android, démontrant ainsi un système intelligent complet pour l’auscultation des sons respiratoires.