
要約
人体活動認識(HAR)には、さまざまな種類のセンサーを用いることができるが、それぞれに異なる長所と短所がある。場合によっては、単一のセンサーではユーザーの動きをその視点から完全に捉えきれず、誤った予測を引き起こすことがある。一方で、センサー融合はHARにさらなる情報を提供するが、ユーザーのプライバシー保護や受容性、高コストな設置・運用・保守といった内在的な課題を伴う。こうした問題に対処するため、本研究では「仮想融合(Virtual Fusion)」という新手法を提案する。この手法は、学習段階で複数の時刻同期されたセンサーからのラベルなしデータを活用しつつ、推論時には単一のセンサーのみを必要とする。センサー間の相関関係を効果的に活用するため、対照学習(contrastive learning)を採用している。実験結果から、単一センサーでの学習と比較して、仮想融合は著しく高い精度を達成しており、場合によっては複数センサーを実際に融合した手法よりも、テスト時における性能を上回ることも確認された。さらに、本手法をより一般的な形に拡張した「仮想融合内での実際融合(Actual Fusion within Virtual Fusion: AFVF)」も提案し、推論時に学習時に使用したセンサーのサブセットを用いることが可能となった。本手法は、UCI-HARおよびPAMAP2のベンチマークデータセットにおいて、最先端の精度およびF1スコアを達成した。実装コードの提供は要請に応じて行う。