2ヶ月前

LSDNet: LSDアルゴリズムの学習可能な変形によるリアルタイム線分検出

Teplyakov, Lev ; Erlygin, Leonid ; Shvets, Evgeny
LSDNet: LSDアルゴリズムの学習可能な変形によるリアルタイム線分検出
要約

今日までに、線分検出(Line Segment Detection: LSD)において最高の精度を達成しているのは、畳み込みニューラルネットワーク(Convolutional Neural Networks: CNNs)を基盤とするアルゴリズムである。しかしながら、これらの手法は深い重いネットワークを利用しており、従来のモデルベースの検出器よりも遅いという欠点がある。本論文では、軽量なCNNを古典的なLSD検出器に組み込むことで、精度が高くかつ高速なCNNベースの検出器LSDNetを開発した。具体的には、元のLSDアルゴリズムの最初のステップである「画像勾配から線分ヒートマップと接線場を構築する」プロセスを軽量なCNNで置き換えた。これによりより複雑で豊富な特徴量を計算することが可能となった。LSDアルゴリズムの後半部分は僅かな修正のみで使用されている。標準的なWireframeデータセット上でいくつかの現代的な線分検出器と比較した結果、提案されたLSDNetはCNNベースの検出器の中で最速の214 FPS(フレーム毎秒)を達成し、競合性のある78 Fh(F-measure)の精度を示した。最も高い報告値は33 FPSで83 Fhであるが、我々はこの精度差がアノテーションにおける誤りによって引き起こされていると考えており、実際の差異は著しく低いものだと推測している。我々は人気のある線分検出ベンチマークであるWireframeおよびYork Urbanにおいてアノテーションに系統的な不整合があることを指摘し、画像のサブセットを慎重に再アノテーションして以下の事実を示した。(i) 既存の検出器は再学習せずに更新されたアノテーションに対して品質が向上しており、新しいアノテーションが正規な線分検出との相関性が高いことを示唆している;(ii) 我々の検出器と他の検出器との間での精度差異は無視できる0.2 Fhに縮小しており、当方法が最速であることが確認された。

LSDNet: LSDアルゴリズムの学習可能な変形によるリアルタイム線分検出 | 最新論文 | HyperAI超神経