
要約
地平線は、多様な画像理解タスクにおいて重要な文脈属性です。そのため、単一の画像からその位置を推定する多くの手法が提案されてきました。これらの手法は通常、消失点、共面円(coplanar circles)、規則的なテクスチャなどの特定の手がかりを画像に含む必要があるため、実世界での適用範囲が制限されています。本研究では、自然画像にラベリングされた地平線を含む大規模かつ現実的な評価データセット「Horizon Lines in the Wild (HLW)」を導入します。このデータセットを使用して、明示的な幾何学的制約や他の特殊な手がかりを必要とせずに地平線を直接推定する畳み込みニューラルネットワーク(CNN)の応用について調査しました。包括的な評価の結果、当社のCNNを単独で使用するか、または以前の幾何学的手法と組み合わせて使用することで、困難なHLWデータセットおよび既存の2つのベンチマークデータセットにおいて最先端の成果を達成することが示されました。