2ヶ月前

DT-LSD: 変形可能なトランスフォーマーを用いた線分検出

Janampa, Sebastian ; Pattichis, Marios
DT-LSD: 変形可能なトランスフォーマーを用いた線分検出
要約

線分検出はコンピュータビジョンにおける基本的な低レベルのタスクであり、このタスクの改善はそれにより依存するより高度な手法に影響を与える可能性があります。線分検出のために開発された新しい手法の多くは、畳み込みニューラルネットワーク(CNN)に基づいています。当論文では、線分検出に変換器(Transformer)ベースの手法をより広く採用する上で障害となる課題に対処することを目指しています。具体的には、多スケール相互作用をサポートし、迅速な学習が可能な新しいモデルである変形可能な変換器ベースの線分検出器(Deformable Transformer-based Line Segment Detection: DT-LSD)を導入します。本研究では、LETRの欠点を解決するための新たな変形可能な変換器ベースの線分検出器(DT-LSD)を提案します。より速い学習のために、一対一のマッチングプロセスを安定させ、学習速度を34倍向上させる技術であるラインコントラスティブデノイジング(Line Contrastive DeNoising: LCDN)を導入しました。実験結果から、DT-LSDは前世代の変換器ベースモデル(LETR)よりも高速かつ精度が高いことが示され、すべてのCNNベースモデルを超える精度を達成しています。Wireframeデータセットにおいて、DT-LSDは$sAP^{10}$で71.7、$sAP^{15}$で73.9の値を記録しており、YorkUrbanデータセットでは$sAP^{10}$で33.2、$sAP^{15}$で35.1となっています。