17日前

完全畳み込みネットワークにおけるグローバルアグリゲーションとローカルディストリビューション

Xiangtai Li, Li Zhang, Ansheng You, Maoke Yang, Kuiyuan Yang, Yunhai Tong
完全畳み込みネットワークにおけるグローバルアグリゲーションとローカルディストリビューション
要約

完全畳み込みネットワーク(FCN)において、グローバル集約モジュールを用いた長距離依存関係のモデリングが、セマンティックセグメンテーションやオブジェクト検出といった複雑なシーン理解タスクにおいて極めて重要であることが広く証明されている。しかし、グローバル集約は大規模なパターンの特徴に支配されやすく、小規模なパターン(例えば境界や小さな物体)を含む領域において過剰に平滑化してしまう傾向がある。この問題を解決するために、本研究では「グローバル集約(Global Aggregation)」の後に「局所分布(Local Distribution)」を適用する新たなアプローチ、すなわちGALD(Global Aggregation then Local Distribution)を提案する。このアプローチにより、長距離依存関係は大規模パターン領域内でより信頼性高く利用され、逆に小規模パターン領域ではその利用が抑制される。各位置におけるパターンサイズは、ネットワーク内でチャネルごとのマスクマップとして推定される。GALDはエンドツーエンドで学習可能であり、さまざまなグローバル集約モジュールを備えた既存のFCNに容易に統合可能で、幅広い視覚タスクにおいて、最先端のオブジェクト検出およびインスタンスセグメンテーション手法の性能を一貫して向上させる。特に、セマンティックセグメンテーションに適用した場合、CityscapesテストセットにおいてmIoU 83.3%という新たな最先端の性能を達成した。コードは以下のURLから公開されている:\url{https://github.com/lxtGH/GALD-Net}

完全畳み込みネットワークにおけるグローバルアグリゲーションとローカルディストリビューション | 最新論文 | HyperAI超神経