15日前
ARSC-Net:チャネル・スパティアル注目機構を有する並列パスを用いた付加的呼吸音分類ネットワーク
{Jianxin Wang, Fan Wu, Hulin Kuang, Jin Liu, Jianhong Cheng, Lei Xu}
要約
近年、付加的呼吸音の自動識別は依然として困難な課題である。この課題に対処するため、本研究では、残差ブロックとチャネル・空間注意力(channel-spatial attention)を組み合わせた付加的呼吸音分類ネットワーク(ARSC-Net)を提案する。具体的には、付加的呼吸音から2種類の特徴量を抽出する:メル周波数ケプストラム係数(MFCCs)とメルスペクトログラム。これらの2種類の特徴量は、残差注意力を備えた並列エンコーダパスに入力され、特徴表現を抽出した後、チャネル・空間注意力モジュールに統合される。これにより、チャネル間および空間的な特徴の重要度を適応的に評価し、分類タスクに有効な特徴に注目する。さらに、チャネル・空間注意力モジュールは特徴表現を強化する機能を有しており、まずチャネル注意力がスペクトルのチャネル間相互関係を探索し、その後、空間注意力を逐次導入して空間的相関マッピングを生成する。本手法はICBHI 2017データベース上で評価された。実験結果から、本手法は正常音と異常音を識別する際、80.0%の精度を達成し、裂音(crackles)と喘鳴(wheezes)を区別する際には92.4%の精度を示した。また、付加的呼吸音の4クラス分類においては56.76%のスコアを達成し、複数の最先端手法を上回る性能を示した。