HyperAIHyperAI

Command Palette

Search for a command to run...

効率的なエッジ検出のためのピクセル差分ネットワーク

Zhuo Su Wenzhe Liu Zitong Yu Dewen Hu Qing Liao Qi Tian Matti Pietikäinen Li Liu

概要

最近、深層畳み込みニューラルネットワーク(CNN)は、豊富で抽象的なエッジ表現能力を活かして、エッジ検出において人間の水準に達する性能を実現している。しかし、このような高精度なCNNベースのエッジ検出は、大規模な事前学習済みCNNバックボーンを用いることで達成されており、メモリおよびエネルギー消費量が非常に大きいという課題がある。さらに、CannyやSobel、LBPといった従来のエッジ検出手法における知見が、急速に発展する深層学習時代においてほとんど検討されていないことは驚きである。こうした問題に対処するため、本研究では、シンプルかつ軽量でありながら効果的な構造を持つ新規アーキテクチャ「ピクセル差分ネットワーク(Pixel Difference Network: PiDiNet)」を提案する。BSDS500、NYUD、Multicueの3つのデータセットにおける広範な実験により、PiDiNetの有効性および高い学習・推論効率を示した。驚くべきことに、BSDS500およびVOCデータセットからのスクラッチ学習でも、PiDiNetはBSDS500データセットにおいて、人間の知覚性能(ODS F-measure 0.807 vs. 0.803)を上回る結果を達成しており、100 FPS、パラメータ数100万未満という極めて効率的な環境下で実現した。さらに、パラメータ数0.1M未満の高速版PiDiNetは、200 FPSで最先端技術と同等の性能を維持している。NYUDおよびMulticueデータセットにおける結果も同様の傾向を示している。コードはGitHubにて公開されており、https://github.com/zhuoinoulu/pidinet から入手可能である。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
効率的なエッジ検出のためのピクセル差分ネットワーク | 記事 | HyperAI超神経