
ニューラルネットワークによって生成される特徴ベクトルの高次統計量を捉えることを目的とし、エンドツーエンドの2次およびそれ以上の高次プーリングを提案してテンソル記述子を構成する。テンソル記述子は、集約されるベクトル数が少ないことや、ある特徴が統計的に予想される頻度よりも頻繁に/まれに出現する「バースト現象(burstiness)」の影響を受けるため、堅牢な類似性測度を必要とする。グラフラプラシアン上の熱拡散過程(Heat Diffusion Process, HDP)は、共分散/自己相関行列の固有値べき正規化(Eigenvalue Power Normalization, EPN)と密接に関連しており、その逆行列はループを含むグラフラプラシアンを構成する。本研究では、HDPとEPNが同一の役割を果たすことを示す。すなわち、固有値スペクトルの大きさを強調または抑制することで、バースト現象を抑制する。高次テンソルにEPNを導入し、これにより高次出現のスペクトル検出器として機能させ、バースト現象の発生を防ぐ。さらに、d次元の特徴記述子から構成されるr次テンソルについて、少なくとも1つの高次出現がテンソルによって表される\binom{d}{r}個の部分空間のいずれかに「射影(projected)」されている場合に、その尤度を算出可能であることを証明する。これにより、\binom{d}{r}個の「検出器」を備えたテンソルべき正規化メトリクスが構築される。実験的貢献として、複数の2次および高次プーリングのバリエーションを行動認識タスクに適用し、従来報告されていなかったこれらのプーリング手法間の比較を実施。また、HMDB-51、YUP++、MPII Cooking Activitiesの各データセットにおいて、最先端の性能を達成した。