
要約
近年、マルチセンサ技術は医療ケア(HC)、人体活動認識(HAR)、産業制御システム(ICS)など多岐にわたる分野に応用されている。これらのセンサは大量の多変量時系列データを生成することができる。マルチセンサ時系列データにおける教師なし異常検出は、機械学習研究において重要な役割を果たしていることが実証されている。その核心的な課題は、マルチセンサデータ内の空間的・時系列的相関を捉え、一般化された正常パターンを発見することにある。さらに、訓練データにノイズデータが混在していることが多く、モデルが正常データ、異常データ、ノイズデータの区別を困難にし、誤った学習を引き起こすリスクがある。これまでの研究の多くは、この二つの課題を同時に解決できていない。本研究では、深層学習に基づく新しい異常検出手法として、深層畳み込み自己符号化器記憶ネットワーク(Deep Convolutional Autoencoding Memory network, CAE-M)を提案する。まず、最大平均差分(MMD)を用いて、マルチセンサデータの空間的依存性を特徴づける深層畳み込み自己符号化器を構築し、ノイズデータ、正常データ、異常データの区別をより正確に行う。次に、時系列データからの時系列的依存性を捉えるために、線形予測(自己回帰モデル)と非線形予測(双方向LSTMとアテンション機構)から構成される記憶ネットワークを設計する。最後に、CAE-Mはこれらの二つのサブネットワークを統合的に最適化する。提案手法は、HARおよびHCデータセットにおいて、複数の最先端異常検出手法と実証的に比較された。実験結果から、本研究で提案するモデルが既存手法を上回る性能を示したことが明らかになった。