CycleGuardian:改良された深層クラスタリングとコントラスト学習を活用した自動呼吸音分類フレームワーク

呼吸音聴診は、呼吸器疾患および肺疾患の早期診断において中心的な役割を果たしている。COVID-19以降、深層学習に基づく自動呼吸音分類手法が登場したものの、限られたデータセットが性能向上を阻害している。正常呼吸音と異常呼吸音の両方に、正常な呼吸成分とノイズ成分が共存しているため、これらを区別することは困難である。さらに、さまざまな異常呼吸音は類似した異常特徴を示すため、それらの識別が困難となる。また、既存の最先端モデルはパラメータ数が多すぎて、リソース制約の厳しいモバイルプラットフォームへの展開を妨げている。こうした課題に対処するため、本研究では軽量なネットワーク「CycleGuardian」を設計し、改良された深層クラスタリングと対照学習(contrastive learning)を組み合わせたフレームワークを提案する。まず、特徴の多様性を高めるためにハイブリッドスペクトログラムを生成し、断続的な異常音の検出を容易にするためにスペクトログラムをグループ化する。次に、CycleGuardianは深層クラスタリングモジュールと類似性制約付きクラスタリング部品を統合し、異常特徴の捉え能力を向上させるとともに、グループ混合を用いた対照学習モジュールを導入することで、異常特徴の識別精度を強化している。多目的最適化により、学習過程における全体的な性能が向上する。実験では、ICBHI2017データセットを用い、公式の分割法に従い、事前学習済み重みを一切使用せずに評価を行った結果、本手法は、精度(Sp)82.06%、再現率(Se)44.47%、スコア(Score)63.26%を達成し、ネットワークモデルサイズは38Mと軽量である。現行の最先端モデルと比較して、スコアにおいて約7%の向上を達成し、現在の最高性能を記録した。さらに、本ネットワークをAndroid端末にデプロイし、包括的な知能型呼吸音聴診システムの実現を示した。