11日前
Π-ネット:深層多項式ニューラルネットワーク
Grigorios G. Chrysos, Stylianos Moschoglou, Giorgos Bouritsas, Yannis Panagakis, Jiankang Deng, Stefanos Zafeiriou

要約
現在、深層畳み込みニューラルネットワーク(DCNNs)は、コンピュータビジョンおよび機械学習分野における生成学習および識別学習の主流手法となっている。DCNNsの成功は、例えば残差ブロックや整流関数(rectifiers)、高度な正規化スキームなど、その構成要素の慎重な選定に起因している。本論文では、新たなDCNNのクラスである$Π$-Netsを提案する。$Π$-Netsは多項式ニューラルネットワークであり、出力が入力の高次多項式として表現される特徴を持つ。$Π$-Netsは特別なスキップ接続(skip connections)を用いて実装可能であり、そのパラメータは高次テンソルによって表現できる。実証的に、$Π$-Netsは従来のDCNNよりも優れた表現能力を有しており、画像、グラフ、音声など多様なタスクおよび信号において、非線形活性化関数を用いなくても良好な結果を達成できることを示した。活性化関数を併用した場合、画像生成などの困難なタスクにおいても最先端の性能を達成する。さらに、本フレームワークにより、最近の生成モデル(たとえばStyleGAN)がその前身(例:ProGAN)をどのように改善しているかについての理解が深まる。