
摘要
本文采用预训练的ResNet模型作为骨干网络,用于异常肺部音的分类及呼吸系统疾病的识别。通过采用常规微调(vanilla fine-tuning)、协同微调(co-tuning)、随机归一化(stochastic normalization)以及协同微调与随机归一化相结合的技术,实现预训练模型知识的有效迁移。此外,为应对ICBHI数据集及本研究构建的多通道肺音数据集中存在的类别不平衡问题,我们在时域和时频域均引入了数据增强策略。同时,针对ICBHI数据集中的设备特性差异,我们进一步应用了频谱校正方法以降低记录设备性能波动带来的影响。实验结果表明,所提出的系统在两个数据集上的异常肺音及呼吸系统疾病分类任务中,整体性能显著优于现有最先进的肺音分类方法。