
要約
私たちは、画像から線分を検出する一段階の完全畳み込み型線解析ネットワーク(F-Clip)を提案します。本ネットワークは非常に単純かつ柔軟で、速度と精度のトレードオフを滑らかに調整できるため、異なる用途に適応可能です。F-Clipは、各線の中心位置、長さ、角度を予測することで、エンドツーエンドで線分を検出します。さらに、私たちの完全畳み込み型ネットワークの畳み込みカーネル設計をカスタマイズし、実際の画像データセットにおける線角度分布の統計的先験知識を効果的に活用しています。私たちは広範な実験を行い、本手法が効率と精度の間で著しく優れたトレードオフを達成していることを示しました。これにより、単一GPU上で最大73 FPS(フレーム毎秒)でのリアルタイム線検出器が実現できました。このような推論速度は、精度を犠牲にすることなくリアルタイムタスクに容易に適用可能となります。また、性能向上型バックボーンネットワークを使用した場合、F-Clipは同様またはそれ以上のフレームレートで最新のすべての線検出器よりも大幅に優れた精度を達成できます。つまり、同じ推論速度においても、F-Clipは他の方法と比較して常に最高の精度を達成します。ソースコード: https://github.com/Delay-Xili/F-Clip.