2ヶ月前
可逆残差ネットワーク
Jens Behrmann; Will Grathwohl; Ricky T. Q. Chen; David Duvenaud; Jörn-Henrik Jacobsen

要約
私たちは、標準的なResNetアーキテクチャを可逆にすることが可能であることを示し、同じモデルが分類、密度推定、および生成に使用できることを確認しました。通常、可逆性の確保には次元の分割やネットワークアーキテクチャの制限が必要です。これに対して、私たちの手法では訓練中に単純な正規化ステップを追加するだけで済みます。この正規化ステップは既存の標準的なフレームワークで利用可能です。可逆ResNetsは、ラベルなしデータに対して最大尤度法により訓練可能な生成モデルを定義します。尤度を計算するために、残差ブロックのヤコビ行列式の対数(Jacobian log-determinant)に対する計算可能な近似法を導入しました。実験評価の結果、可逆ResNetsは最先端の画像分類器とフローベースの生成モデル双方において競争力のある性能を示しており、これは単一のアーキテクチャで達成された初めての事例です。