11日前

非パラメトリックな二標本検定のための深層カーネル学習

Feng Liu, Wenkai Xu, Jie Lu, Guangquan Zhang, Arthur Gretton, Danica J. Sutherland
非パラメトリックな二標本検定のための深層カーネル学習
要約

我々は、2つのサンプル集合が同一の分布から抽出されたかどうかを検定する目的で、カーネルに基づく2標本検定のクラスを提案する。本検定は、検定のパワーを最大化するように学習された深層ニューラルネットワークによってパラメータ化されたカーネルから構成される。これらのカーネルは、空間における分布の滑らかさや形状の変化に適応可能であり、特に高次元かつ複雑なデータに対して優れた性能を発揮する。一方、従来のカーネル検定手法で用いられる単純なカーネルは空間的に均質であり、スケールパラメータ(lengthscale)のみに適応可能である。本手法が、広く用いられている分類器に基づく2標本検定を特別なケースとして含みつつ、一般的な状況においてそれらを改善することを説明する。また、本研究では、深層特徴上のカーネルおよびより単純なラジアル基底関数カーネルや複数カーネル学習(multiple kernel learning)に対しても、提案手法の収束性(consistency)に関する初めての理論的証明を提供する。実験において、ベンチマークデータおよび実世界のデータにおける仮説検定において、本手法が深層カーネルを用いることで優れた性能を発揮することを示した。本研究で開発した深層カーネルを用いた2標本検定の実装コードは、https://github.com/fengliu90/DK-for-TST にて公開されている。

非パラメトリックな二標本検定のための深層カーネル学習 | 最新論文 | HyperAI超神経