15 天前
ARSC-Net:基于并行路径与通道-空间注意力机制的意外呼吸音分类网络
{Jianxin Wang, Fan Wu, Hulin Kuang, Jin Liu, Jianhong Cheng, Lei Xu}
摘要
近年来,偶然性呼吸音的自动识别仍然是一个具有挑战性的问题。为应对这一挑战,本文提出了一种偶然性呼吸音分类网络(Adventitious Respiratory Sound Classification Network, ARSC-Net),该网络结合了残差块与通道-空间注意力机制,以实现更精确的分类。具体而言,本文从偶然性呼吸音中提取两类特征:梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients, MFCCs)和梅尔频谱图(Mel-spectrogram)。这两类特征被分别输入至并行的编码路径中,并结合残差注意力机制以提取有效的特征表示,随后在通道-空间注意力模块中进行融合,从而自适应地聚焦于通道维度与空间维度之间的关键特征,以提升分类性能。此外,通道-空间注意力机制能够增强特征表达能力:其中通道注意力用于挖掘频谱图中不同通道间的相互关系,而空间注意力则在序列化结构中进一步生成通道间的空间相关性映射。我们在ICBHI 2017数据库上对所提出方法进行了评估。实验结果表明,该方法在区分正常呼吸音与异常呼吸音的任务中取得了80.0%的分类准确率,在区分爆裂音(crackles)与哮鸣音(wheezes)的任务中达到了92.4%的准确率。此外,在四类偶然性呼吸音的分类任务中,该方法取得了56.76%的综合评分,优于多项现有先进方法。