
要約
非局所モジュールは、セマンティックセグメンテーションに特に有用な技術として機能していますが、その計算量の多さとGPUメモリの占有量の多さにより批判を受けています。本論文では、セマンティックセグメンテーション向けの非対称非局所ニューラルネットワーク(Asymmetric Non-local Neural Network, ANN)を提案します。このネットワークには2つの主要な構成要素があります:非対称ピラミッド非局所ブロック(Asymmetric Pyramid Non-local Block, APNB)と非対称融合非局所ブロック(Asymmetric Fusion Non-local Block, AFNB)です。APNBは、ピラミッドサンプリングモジュールを非局所ブロックに組み込むことで、性能を犠牲にすることなく計算量とメモリ消費量を大幅に削減します。AFNBはAPNBから派生し、長距離依存関係を十分に考慮した上で異なるレベルの特徴を融合することで、性能を大幅に向上させます。セマンティックセグメンテーションベンチマークでの広範な実験により、当研究の有効性と効率性が示されています。特に、Cityscapesテストセットにおいて81.3 mIoUという最先端の性能を達成しました。256x128の入力に対して、APNBはGPU上での処理速度が非局所ブロックの約6倍速く、GPUメモリ占有量も約28分の1となっています。コードは以下のURLで公開されています:https://github.com/MendelXu/ANN.git