
要約
伝統的な畳み込み層では、学習したフィルターは訓練後固定されます。これに対して、当研究では新たなフレームワークである動的フィルターネットワーク(Dynamic Filter Network)を導入します。このアーキテクチャにおいては、フィルターが入力に応じて動的に生成されるため、適応性の向上により柔軟性が増加しますが、モデルパラメータ数の過度な増加は見られません。この方法により、局所空間変換などの多様なフィルタリング操作を学習することが可能となりますが、選択的な(ぼかし)除去や適応的な特徴抽出なども含まれます。さらに、このような層を複数組み合わせることも可能で、例えば再帰型アーキテクチャでの使用が考えられます。動的フィルターネットワークの有効性をビデオ予測とステレオ予測の課題で示し、移動MNISTデータセットにおいてはより小さなモデルで最先端の性能を達成しました。学習したフィルターの可視化を通じて、ネットワークが未ラベルの訓練データのみを見ることでフロー情報を獲得していることを示しています。これは、動的フィルターネットワークが光学フロー推定や深度推定などの様々な監督課題に対する事前学習に無教師学習方式で利用できる可能性があることを示唆しています。