16日前

マルチスケール特徴からのマハラノビス距離メトリック学習を用いたTransformerベースモデルのアンサンブルによる少サンプル軸受故障診断

{Men-Tzung Lo, Van-Truong Pham, Thi-Thao Tran, Van-Quang Nguyen, Manh-Hung Vu}
要約

高度な深層学習モデルは、従来の機械学習および信号処理手法と比較して、故障軸受診断タスクにおいて優れた性能を示している。また、限られた学習データという課題に対処するために、少サンプル学習(few-shot learning)アプローチも注目を集めている。しかし、最先端の故障軸受診断モデルの多くは、入力データの局所的特徴に注目する畳み込みニューラルネットワーク(CNN)に基づいている。さらに、データのばらつき、故障種別、取得条件の違い、極めて限られたデータ量といった要因により、故障軸受信号の正確な分類は依然として困難であり、この分野における研究の余地が残されている。本研究では、人工的および実際の故障を含む限られたデータ条件下でも有効な、新しいエンドツーエンドの故障軸受診断アプローチを提案する。特に、入力データから自動的に特徴を抽出するモジュールとして「マルチスケール大カーネル特徴抽出(multiscale large kernel feature extraction)」を提案する。抽出された特徴は、グローバル・ブランチとローカル・ブランチから構成される二本のブランチモデルに供給される。グローバル・ブランチは、クロスアテンションを備えたトランスフォーマー構造を採用し、グローバルな文脈を処理し、クエリセットとサポートセット間の相関関係を捉える。一方、ローカル・ブランチはメトリックベースのモデルであり、マハラノビス距離(Mahalanobis distance)を用いてサポートセットからの局所的特徴を分離する。二つのブランチの出力を統合(アンサンブル)することで最終的な分類を実現する。本研究では、CWRUおよびPUの2つの公的データセットを用いて、包括的な実験およびアブレーションスタディを実施した。提案手法と他の最先端手法との比較において、異なる学習サンプル数における定性的・定量的評価結果から、本手法の優れた性能が明らかになった。本研究の実装コードは、https://github.com/HungVu307/Few-shot-via-ensembling-Transformer-with-Mahalanobis-distance にて公開予定である。