11日前

効率的なエッジ検出のためのピクセル差分ネットワーク

Zhuo Su, Wenzhe Liu, Zitong Yu, Dewen Hu, Qing Liao, Qi Tian, Matti Pietikäinen, Li Liu
効率的なエッジ検出のためのピクセル差分ネットワーク
要約

最近、深層畳み込みニューラルネットワーク(CNN)は、豊富で抽象的なエッジ表現能力を活かして、エッジ検出において人間の水準に達する性能を実現している。しかし、このような高精度なCNNベースのエッジ検出は、大規模な事前学習済みCNNバックボーンを用いることで達成されており、メモリおよびエネルギー消費量が非常に大きいという課題がある。さらに、CannyやSobel、LBPといった従来のエッジ検出手法における知見が、急速に発展する深層学習時代においてほとんど検討されていないことは驚きである。こうした問題に対処するため、本研究では、シンプルかつ軽量でありながら効果的な構造を持つ新規アーキテクチャ「ピクセル差分ネットワーク(Pixel Difference Network: PiDiNet)」を提案する。BSDS500、NYUD、Multicueの3つのデータセットにおける広範な実験により、PiDiNetの有効性および高い学習・推論効率を示した。驚くべきことに、BSDS500およびVOCデータセットからのスクラッチ学習でも、PiDiNetはBSDS500データセットにおいて、人間の知覚性能(ODS F-measure 0.807 vs. 0.803)を上回る結果を達成しており、100 FPS、パラメータ数100万未満という極めて効率的な環境下で実現した。さらに、パラメータ数0.1M未満の高速版PiDiNetは、200 FPSで最先端技術と同等の性能を維持している。NYUDおよびMulticueデータセットにおける結果も同様の傾向を示している。コードはGitHubにて公開されており、https://github.com/zhuoinoulu/pidinet から入手可能である。

効率的なエッジ検出のためのピクセル差分ネットワーク | 最新論文 | HyperAI超神経