2ヶ月前

ParseNet: より広く見るためによりよく見る

Wei Liu; Andrew Rabinovich; Alexander C. Berg
ParseNet: より広く見るためによりよく見る
要約

私たちは、セマンティックセグメンテーションのための深層畳み込みネットワークにグローバルコンテキストを追加する技術を提案します。この手法は単純で、レイヤーの平均特徴量を使用して各位置の特徴量を補完します。さらに、学習のいくつかの特性について研究を行い、ベースラインネットワーク(例:FCN)の性能を大幅に向上させています。私たちが提案するグローバル特徴量と正規化パラメータを学習する技術を追加すると、ベースラインの改良版でも一貫して精度が向上します。私たちが提案するアプローチであるParseNetは、SiftFlowやPASCAL-Contextにおいてベースラインよりも僅かな計算コストで最先端の性能を達成し、PASCAL VOC 2012 セマンティックセグメンテーションでは単純な手法ながら現行の最先端に近い性能を示しています。コードは https://github.com/weiliu89/caffe/tree/fcn から入手可能です。

ParseNet: より広く見るためによりよく見る | 論文 | HyperAI超神経