
要約
深層教師あり学習の成功は、自動的にデータ表現を学習する能力に依存している。高次元かつ複雑なデータの良好な表現は、情報損失を最小限に抑えつつ、低次元化と分離性(disentanglement)を両立する必要がある。本研究では、再生核ヒルベルト空間(RKHS)および生成的対抗ネットワーク(GAN)を用いて、深層表現学習の目標がどのように達成可能であるかを統計的観点から明らかにする。母集団レベルでは、理想的な表現学習タスクを、条件付き独立性(RKHSを用いて定式化)と分離性(GANを用いて定式化)を特徴づける損失関数の和を最小化する非線形写像の探索問題として定式化する。サンプルレベルでは、深層ニューラルネットワークを用いて非パラメトリックに目的写像を推定する。さらに、母集団の目的関数値に関する一貫性(consistency)を理論的に証明する。提案手法の有効性は、回帰および分類の文脈における包括的な数値実験および実データ解析により検証された。その結果得られた予測精度は、既存の最先端手法を上回っている。