2ヶ月前
双方向カスケードネットワークによる知覚エッジ検出
Jianzhong He; Shiliang Zhang; Ming Yang; Yanhu Shan; Tiejun Huang

要約
異なるスケールの物体のエッジ検出を改善するために、マルチスケール表現の活用が重要です。大幅に異なるスケールのエッジを抽出するため、私たちは特定のスケールに対応したラベル付きエッジによって個々の層が監督される構造である双方向カスケードネットワーク(Bi-Directional Cascade Network: BDCN)を提案します。これに対して、同じ監督情報をすべてのCNN出力に直接適用する方法ではなく、BDCNで学習されるマルチスケール表現を豊かにするために、ディライトド畳み込みを使用してマルチスケール特徴量を生成するスケール強化モジュール(Scale Enhancement Module: SEM)を導入しました。深層CNNや明示的なマルチスケールエッジマップの融合を使用せずとも、これらの新しいアプローチは異なる層でのマルチスケール表現の学習を促進し、そのスケールによって明確に定義されたエッジを検出することができます。また、スケール専門の層を学習することで、パラメータ数が少ないコンパクトなネットワークも実現できます。私たちの手法はBSDS500、NYUDv2、Multicueという3つのデータセットで評価され、BSDS500では最高峰値F値(ODS F-measure)が0.828となり、現行の最先端技術よりも1.3%高い結果を得ました。コードはhttps://github.com/pkuCactus/BDCN で公開されています。