11日前

AUCO ResNet:咳および呼吸からのCOVID-19事前スクリーニングを目的としたエンドツーエンドネットワーク

{Giuseppe Pirlo, Luigi Moretti, Donato Impedovo, Paolo Giglio, Vincenzo Dentamaro}
要約

本研究では、音声分類、特に咳や呼吸音の音声データから新型コロナウイルス(Covid-19)を識別することを目的として、生物学的にインスパイアされた深層ニューラルネットワーク「聴覚皮質ResNet(AUCO ResNet)」を提案する。他のアプローチとは異なり、エンド・ツー・エンドで学習可能であり、勾配降下法を用いて学習アルゴリズムのすべてのモジュール——メル型フィルタ設計、特徴抽出、特徴選択、次元削減、予測——を同時に最適化できる。本ネットワークには、 squeeze-and-excitation機構、畳み込みブロック注意モジュール、および新規に提案された正弦波可学習注意機構の3つの注意機構を組み込んでいる。これらの注意機構は、ネットワーク内の異なる階層における活性化マップから関連する情報を統合する能力を有している。AUCO ResNetは、生の音声ファイルを入力とし、特徴抽出段階の微調整も可能である。実際、学習過程でメル型フィルタが設計され、重要周波数に応じてフィルタバンクが適応的に調整される。AUCO ResNetは、多数のデータセットにおいて最先端の性能を示している。まず、Covid-19に起因する咳や呼吸音を含む多数のデータセットで検証された。この選択は、咳や呼吸音が言語に依存しないため、異なるデータセット間での一般化を目的としたクロスデータセットテストが可能になるという点に起因している。これらの実験結果から、本手法が低コスト、高速、遠隔で利用可能なCovid-19事前スクリーニングツールとして採用可能であることが示された。さらに、著名なUrbanSound 8Kデータセットでも評価が行われ、いかなるデータ前処理やデータ拡張技術を用いずに、最先端の精度を達成した。

AUCO ResNet:咳および呼吸からのCOVID-19事前スクリーニングを目的としたエンドツーエンドネットワーク | 最新論文 | HyperAI超神経