17日前

ResNeSt:Split-Attention Networks

Hang Zhang, Chongruo Wu, Zhongyue Zhang, Yi Zhu, Haibin Lin, Zhi Zhang, Yue Sun, Tong He, Jonas Mueller, R. Manmatha, Mu Li, Alexander Smola
ResNeSt:Split-Attention Networks
要約

特徴マップに対する注目(attention)とマルチパス表現は、視覚認識において重要な役割を果たしていることは広く知られている。本論文では、異なるネットワークブランチに対してチャネル単位の注目機構を適用することで、特徴間の相互作用を効果的に捉え、多様な表現を学習するという既存手法の利点を活かす、モジュール型アーキテクチャを提案する。本設計により、シンプルかつ統一的な計算ブロックが実現され、少数のパラメータでパラメータ化可能となる。このモデルは「ResNeSt」と命名され、画像分類タスクにおいて、EfficientNetと比較して精度と遅延のトレードオフにおいて優れた性能を発揮した。さらに、複数の公開ベンチマークにおいて、バックボーンとして使用した際の転移学習性能も優れており、COCO-LVISチャレンジの優勝エントリでも採用されている。本研究の完全なシステムおよび事前学習済みモデルのソースコードは、公開されている。

ResNeSt:Split-Attention Networks | 最新論文 | HyperAI超神経