1ヶ月前
GCNet: Non-local Networks と Squeeze-Excitation Networks の融合およびその先へ
Yue Cao; Jiarui Xu; Stephen Lin; Fangyun Wei; Han Hu

要約
非局所ネットワーク(Non-Local Network: NLNet)は、各クエリ位置にクエリ固有の全般的コンテキストを集約することにより、長距離依存関係を捉える革新的な手法を提示しています。しかし、厳密な実証分析を通じて、非局所ネットワークがモデル化する全般的コンテキストは画像内の異なるクエリ位置に対してほぼ同一であることが判明しました。本論文では、この知見を活用し、精度を維持しながら計算量を大幅に削減できるクエリ非依存の簡易ネットワークを作成します。さらに、この簡易設計がSqueeze-Excitation ネットワーク(SENet)と類似した構造を持つことを観察しました。したがって、これらを全般的コンテキストモデリングのための三段階一般フレームワークに統合します。一般フレームワーク内において、軽量で効果的に全般的コンテキストをモデル化できる更好的具体化(better instantiation)であるグローバルコンテキスト(GC)ブロックを設計しました。この軽量性により、バックボーンネットワークの複数層に適用してグローバルコンテキストネットワーク(GCNet)を構築でき、主要なベンチマークにおいて様々な認識タスクで簡易NLNetおよびSENetよりも優れた性能を示します。コードと設定は https://github.com/xvjiarui/GCNet で公開されています。注:「更好的具体化」は一般的な日本語表現がないため、「更好的具体化 (better instantiation)」として括弧内に原文を記載しました。