
要約
セマンティックラインは画像のレイアウトを特徴付ける。画像解析およびシーン理解においてその重要性が認識されているにもかかわらず、セマンティックライン検出に関する信頼性の高い研究はこれまで存在しなかった。本論文では、分類と回帰の2つのタスクの組み合わせとしてライン検出を捉え、マルチタスク学習を用いた畳み込みニューラルネットワークを用いたセマンティックライン検出器を提案する。入力画像に対して畳み込み層およびマックスプーリング層を用いて、多スケールの特徴マップを取得する。その後、各候補ラインに対し特徴マップから特徴ベクトルを抽出するためのラインプーリング層を設計する。続いて、得られた特徴ベクトルを並列に接続された分類層および回帰層に投入する。分類層は、候補ラインがセマンティックラインであるか否かを判定する。セマンティックラインと判定された場合、回帰層はライン位置の微調整に用いるオフセットを決定する。実験結果から、提案手法がセマンティックラインを正確かつ信頼性高く抽出できることを示した。さらに、本検出器が水平線推定、構図の向上、画像の簡略化という3つの応用においても成功裏に活用可能であることを示した。