11日前
PIDNet:PIDコントローラーに着想を得たリアルタイムなセマンティックセグメンテーションネットワーク
Jiacong Xu, Zixiang Xiong, Shankar P. Bhattacharyya

要約
二本枝ネットワークアーキテクチャは、リアルタイムセマンティックセグメンテーションタスクにおいてその効率性と有効性を示している。しかし、高解像度の詳細情報と低周波数の文脈情報の直接融合は、詳細特徴が周囲の文脈情報に押しのけられやすいという欠点を有する。この過剰応答(オーバーシュート)現象は、既存の二本枝モデルのセグメンテーション精度の向上を制限している。本論文では、畳み込みニューラルネットワーク(CNN)と比例積分微分制御(PID制御)器との間に新たな接点を設け、二本枝ネットワークが本質的にオーバーシュート問題を抱える比例積分(PI)制御器と等価であることを明らかにした。この問題を緩和するために、本研究では新しい三本枝ネットワークアーキテクチャであるPIDNetを提案する。PIDNetは、詳細情報、文脈情報、境界情報のそれぞれを処理する三つの枝を備え、境界注意機構を用いて詳細枝と文脈枝の融合をガイドする。本研究で提案するPIDNet系列は、推論速度と精度の間で最も優れたトレードオフを達成しており、CityscapesおよびCamVidデータセットにおいて、同程度の推論速度を持つ既存のすべてのモデルを上回る精度を達成した。具体的には、PIDNet-SはCityscapesで93.2 FPSの推論速度で78.6%のmIOUを、CamVidでは153.7 FPSの速度で80.1%のmIOUを達成した。