11日前

意味のあるライン検出のためのディープ・フーリエ変換

Kai Zhao, Qi Han, Chang-Bin Zhang, Jun Xu, Ming-Ming Cheng
意味のあるライン検出のためのディープ・フーリエ変換
要約

自然シーンにおける意味のある線構造(いわゆるセマンティックライン)を検出するという基本的なタスクに焦点を当てる。従来の多くの手法は、この問題をオブジェクト検出の特殊なケースとして扱い、既存のオブジェクト検出器をセマンティックライン検出に適応させてきた。しかし、これらのアプローチは線の本質的な特性を無視しており、最適な性能を発揮できていない。線は複雑なオブジェクトと比べてはるかに単純な幾何学的性質を持つため、少数のパラメータでコンパクトに表現可能である。この線の性質をより効果的に活用するため、本論文では古典的なフーフ変換技術を深層学習による表現と組み合わせ、ライン検出のためのワンショットかつエンドツーエンド学習フレームワークを提案する。線を傾きと切片でパラメータ化することで、深層表現をパラメトリック領域に変換するためのフーフ変換を実行し、その領域でライン検出を行う。具体的には、特徴マップ面上の候補となる線に沿って特徴を統合し、その統合された特徴をパラメトリック領域内の対応する位置に割り当てる。その結果、空間領域におけるセマンティックライン検出問題は、パラメトリック領域における単一の点の検出問題に変換され、後処理ステップ(特に非最大抑制)がより効率的になる。さらに、本手法は、特定のラインに近接するライン沿いの特徴といった文脈情報の抽出を容易にし、正確なライン検出に不可欠な特徴の取得を可能にする。本手法の提案に加え、ライン検出の品質を評価するための新しい評価指標を設計し、ライン検出タスク用の大規模データセットを構築した。提案したデータセットおよび他の公開データセットにおける実験結果から、従来の最先端手法と比較して本手法の優位性が明確に示された。

意味のあるライン検出のためのディープ・フーリエ変換 | 最新論文 | HyperAI超神経