摘要
自动化听诊已成为医学领域中用于诊断与预测分析的热点课题。自动化听诊旨在提升电子听诊器所记录呼吸音的分类性能。研究人员投入大量精力开发智能听诊方法,以提高听诊效率并辅助临床决策,近年来深度神经网络技术被广泛应用于该领域。然而,基于深度神经网络(DNN)的方法性能高度依赖于数据量。遗憾的是,目前全球最大的公开呼吸音数据集ICBHI,仅包含6898个呼吸周期,总时长仅为5.5小时,这一数据规模已成为制约DNN模型进一步优化的关键瓶颈。为此,本文提出一种面向呼吸音分类的数据增强方法,通过引入输入变换与迁移策略实现数据扩充。此外,本研究还对计算机视觉领域中常用的经典处理流程进行了改进。实验结果表明,所提出的增强方法在分离性能上优于基线方法。尤其值得注意的是,该数据增强策略可便捷地集成至现有的自动化听诊系统中,具有良好的可应用性与推广价值。