2ヶ月前

FiLM: 一般的条件付き層を用いた視覚的推論

Ethan Perez; Florian Strub; Harm de Vries; Vincent Dumoulin; Aaron Courville
FiLM: 一般的条件付き層を用いた視覚的推論
要約

私たちは、ニューラルネットワークの汎用的な条件付け手法としてFiLM(Feature-wise Linear Modulation)を紹介します。FiLM層は、条件付け情報に基づく単純な特徴量ごとのアフィン変換を通じて、ニューラルネットワークの計算に影響を与えます。私たちは、標準的な深層学習手法が明示的に推論をモデル化しない場合に困難を伴う視覚的推論——画像に関連する質問に答えるための多段階で高レベルなプロセス——において、FiLM層が非常に効果的であることを示します。具体的には、視覚的推論タスクにおいてFiLM層が 1) CLEVRベンチマークでの最先端の誤差を半分以下に削減し、2) 特徴量を一貫した方法で調節し、3) 部分切除やアーキテクチャの変更に対して堅牢であり、4) 少数の例やゼロショットからでも挑戦的な新しいデータに対する汎化性能が高いことを示しています。

FiLM: 一般的条件付き層を用いた視覚的推論 | 最新論文 | HyperAI超神経