要約
自動聴診は、診断および予測解析の分野において、近年注目を集めるトピックとなっている。自動聴診の目的は、電子式聴診器によって記録された呼吸音の分類精度を向上させることにある。研究者たちは、聴診の効率を高め、臨床医の支援を強化するため、知能型聴診手法の開発に多大な努力を注いでいる。特に近年では、深層ニューラルネットワーク(DNN)技術が広く活用されている。しかし、DNNベースの手法の性能はデータ量に大きく依存しており、現状では世界最大の公開呼吸音データセットであるICBHIでさえ、合計5.5時間に及ぶ6,898個の呼吸サイクルしか保有していないという限界があり、DNNモデルのさらなる性能向上を阻む要因となっている。そこで本研究では、呼吸音分類のためのデータ拡張手法を提案する。本手法では、入力変換と移行学習(migration)を組み合わせたアプローチを実装している。さらに、コンピュータビジョン分野で一般的に用いられる従来のパイプラインも、本研究において改良されている。実験結果から、提案手法によるデータ拡張が、ベースライン手法と比較して分離性能の向上を実現したことが示された。特に、本手法は既存の自動聴診アプローチに容易に統合可能であることが確認された。