
要約
交通シーンにおける極端な状況(エッジケース)における意味的セグメンテーションの堅牢性は、スマート交通システムの安全性にとって極めて重要な要素である。しかし、交通事故の多くが極めて動的な状況であり、かつ従来のデータセットでは見られなかった未踏の状況であるため、意味的セグメンテーション手法の性能に深刻な影響を及ぼす。さらに、高速走行時の従来型カメラの遅延により、時間軸方向における文脈情報がさらに損なわれる。そこで本研究では、より高い時間分解能を持つイベントベースデータから動的文脈を抽出し、静的なRGB画像を補完することを提案する。これは、運動ブラー、衝突、変形、転覆など、さまざまな事故状況を含む画像に対しても有効である。また、事故状況におけるセグメンテーション性能を評価するため、複数の事故シナリオを含むピクセル単位でアノテーションされたデータセット「DADA-seg」を公開する。実験の結果、イベントベースデータは、事故における高速移動物体(衝突対象)の細粒度な運動情報を保持することで、悪条件下でも意味的セグメンテーションの安定性を高める補完的な情報を提供することが示された。本手法は、提案された事故データセットにおいて、平均で+8.2%の性能向上を達成し、20種類以上の最先端の意味的セグメンテーション手法を上回った。また、Cityscapes、KITTI-360、BDD、ApolloScapeなど、複数の異なるソースデータベースで学習されたモデルに対しても、一貫して有効性が確認されている。