18日前

Transformerを用いた動的カーネル生成による車線検出

{Kate Smith-Miles, Guoqi Qian, Bo Du, Mingming Gong, Yu Liu, Ziye Chen}
Transformerを用いた動的カーネル生成による車線検出
要約

最先端の車線検出手法は、車線の特徴(例えば直線やパラメトリック曲線など)に関する事前知識を活用して車線を検出する場合が多い。このような事前知識を用いることでモデル構築が容易になる一方で、複雑なトポロジーを持つ車線(例:密集している、分岐している、曲がっているなど)の処理には課題が生じる。近年、動的畳み込み(dynamic convolution)に基づく手法が注目されており、車線の特定のキーポイント(例:始点)から得られる特徴量を畳み込みカーネルとして用い、全体の特徴マップに対して畳み込み演算を行うことで車線を検出する。このような手法は事前知識への依存を軽減するが、車線が長く細い構造を持つため、キーポイントから生成されたカーネルは車線のグローバルな構造を十分に捉えられず、複雑なトポロジーを持つ車線の検出精度が低下する。さらに、キーポイントから得られるカーネルは遮蔽や車線の交差に敏感であるという問題もある。これらの課題を克服するため、本研究ではトランスフォーマーを活用した動的カーネル生成アーキテクチャを提案する。本手法は、入力画像内の各車線に対してトランスフォーマーを用いて動的畳み込みカーネルを生成し、生成されたカーネルを用いて動的畳み込みにより車線を検出する。キーポイントからのカーネル生成と比較して、トランスフォーマーによって生成されるカーネルは全体の特徴マップから車線のグローバル構造を捉えることができ、遮蔽や複雑なトポロジーを持つ車線の処理において優れた性能を発揮する。提案手法は3つの車線検出ベンチマークで評価された結果、最先端の性能を達成した。特に、OpenLaneではF1スコア63.40を達成し、既存手法を4.30ポイント上回り、CurveLanesでは88.47のF1スコアを記録し、既存手法を2.37ポイント上回った。

Transformerを用いた動的カーネル生成による車線検出 | 最新論文 | HyperAI超神経