2ヶ月前
U$^2$-Net: ネストされたU構造を用いたより深い層での注目物体検出
Qin, Xuebin ; Zhang, Zichen ; Huang, Chenyang ; Dehghan, Masood ; Zaiane, Osmar R. ; Jagersand, Martin

要約
本論文では、注目物体検出(SOD)のための単純でありながら強力な深層ネットワークアーキテクチャ、U²-Netを設計しました。当該U²-Netのアーキテクチャは二段階のネストされたU構造となっています。この設計には以下の利点があります:(1) 提案したReSidual U-blocks (RSU)において異なるサイズの受容野が混在しているため、異なるスケールからより多くのコンテキスト情報を捉えることが可能となります、(2) これらのRSUブロックでプーリング操作を使用しているため、計算コストを大幅に増加させずに全体的なアーキテクチャの深さを増やすことができます。このアーキテクチャにより、画像分類タスクからのバックボーンを使用せずに、ゼロから深層ネットワークを学習することが可能となりました。提案したアーキテクチャに基づく二つのモデル、U²-Net(176.3 MB、GTX 1080Ti GPU上で30 FPS)とU²-Net†(4.7 MB、40 FPS)を実装し、異なる環境での使用を容易にしました。両モデルとも6つのSODデータセットで競合する性能を達成しています。コードは以下から入手可能です:https://github.com/NathanUA/U-2-Net。