17日前

標準化最大ロジット:都市景観セグメンテーションにおける予期せぬ道路障害物の同定のためのシンプルでありながら効果的なアプローチ

Sanghun Jung, Jungsoo Lee, Daehoon Gwak, Sungha Choi, Jaegul Choo
標準化最大ロジット:都市景観セグメンテーションにおける予期せぬ道路障害物の同定のためのシンプルでありながら効果的なアプローチ
要約

道路における予期しない物体(例:道路にいる犬)の検出は、安全が重要な応用分野において極めて重要である。従来の手法は、外部データセットからの予期しない物体の画像を使用するか、追加の学習(例えば、セグメンテーションネットワークの再学習や追加のネットワークの訓練)を必要とするが、これらは膨大な労力や長時間の推論を要する。一つの代替手段として、事前学習済みネットワークの予測スコア(例:最終のソフトマックス層前のクラスごとの最大ロジット、すなわちmax logits)を用いてこのような物体を検出する方法が考えられる。しかし、各予測クラスにおけるmax logitsの分布は著しく異なり、都市シーンにおける予期しない物体の識別性能を低下させる要因となる。この問題に対処するために、本研究では、max logitsの分布を標準化するシンプルでありながら効果的なアプローチを提案する。これにより、異なるクラス間でのmax logitsの分布を統一し、各クラス内におけるmax logitsの相対的な意味を適切に反映できるようにする。さらに、隣接するピクセルは類似した意味情報を共有するという直感に基づき、局所領域を二つの異なる視点から捉える。従来の手法とは異なり、本手法は外部データセットの利用も、追加の学習も不要であるため、既存の事前学習済みセグメンテーションモデルに広く適用可能である。このシンプルなアプローチは、公開されたFishyscapes Lost & Foundリーダーボードにおいて、大幅な差をもって新たな最先端性能を達成した。本研究のコードは、以下のリンクから公開されている:\href{https://github.com/shjung13/Standardized-max-logits}{https://github.com/shjung13/Standardized-max-logits}。

標準化最大ロジット:都市景観セグメンテーションにおける予期せぬ道路障害物の同定のためのシンプルでありながら効果的なアプローチ | 最新論文 | HyperAI超神経