
要約
本稿では、付加肺音および呼吸器疾患の分類に向け、事前学習済みResNetモデルをバックボーンアーキテクチャとして用いる。事前学習モデルの知識を、単純なファインチューニング、コチューニング(co-tuning)、確率的正規化(stochastic normalization)、およびこれら2つの手法を組み合わせた手法を用いて転移学習する。さらに、ICBHIデータセットおよび本研究で構築したマルチチャネル肺音データセットにおけるクラス不均衡に対処するため、時間領域および時間周波数領域におけるデータ拡張を実施する。また、ICBHIデータセットにおいては、記録装置の特性差異を考慮するためにスペクトル補正を適用している。実験的に、提案手法は両データセットにおける付加肺音および呼吸器疾患の分類において、従来の最先端手法を上回る性能を示した。