ランプ検出のための対照学習:クロス類似性を用いた手法

道路シーンにおける車線マークの検出は、その複雑な形状特性と悪化しやすい可視性のため、大きな課題を抱えている。車線マークには明確な形状に関する事前知識(shape prior)があるものの、照明条件の変化、他の車両や歩行者による遮蔽、および時間経過による色褪せといった要因によって、その可視性は容易に損なわれる。さらに、複数の車線形状や自然な形状変動が存在するため、モデルの訓練には多量のデータが必要であり、さまざまな状況に対応可能な堅牢な車線検出モデルの構築が困難である。本論文では、現実世界の状況、特に車線の可視性が低下した場合においてもモデルの耐性を高めるため、新たな自己教師学習手法である「クロス類似性を用いた車線検出のための対照学習(Contrastive Learning for Lane Detection via cross-similarity, CLLD)」を提案する。CLLDは、入力画像のグローバルな文脈の中で局所的な特徴間の類似性を評価する対照学習(Contrastive Learning, CL)手法を導入し、周囲の情報を活用して車線マークを予測する。この目的を達成するために、局所特徴の対照学習と、本研究で提案する「クロス類似性(cross-similarity)」演算を統合している。局所特徴CLは、小さな画像パッチから特徴を抽出することに注力し、車線セグメントの正確な局所化を可能にする。一方、クロス類似性はグローバルな特徴を捉えることで、周囲の状況に基づいて遮蔽された車線セグメントを検出する能力を有する。さらに、データオーギュメンテーションの過程で入力画像の一部をランダムにマスキングすることで、クロス類似性の性能を強化している。TuSimpleおよびCuLaneベンチマークにおける広範な実験結果から、CLLDは従来の最先端対照学習手法を上回り、特に影による可視性低下といった困難な条件下でも優れた性能を示す。また、通常条件においても、他の手法と同等の結果を達成している。特に、実車両走行において頻発する影や混雑した状況といった困難なシナリオにおいて、教師あり学習法と比較してもCLLDは顕著な優位性を発揮している。