17日前
分布外検出のための拡散モデル:道路シーンおよびそれ以外の分野へ
Silvio Galesso, Philipp Schröppel, Hssan Driss, Thomas Brox

要約
近年、セマンティックセグメンテーションにおける分布外(OoD)検出に関する研究は、主にセマンティック多様性が限定的な道路シーンに集中していた。本研究では、この制約に挑戦し、本タスクの適用領域を一般自然画像へ拡張する。これを実現するため、以下の2つの貢献を提示する:1)ADE20kデータセットに基づき、多様なドメインから構成され、高いセマンティック多様性を有する画像を含む「ADE-OoDベンチマーク」の導入、および2)セマンティック分布内埋め込みを対象にMLP構造の拡散モデルを学習し、スコアマッチングの解釈に基づいて推論時に画素単位のOoDスコアを計算する、OoD検出に向けた新しいアプローチ「DOoD(Diffusion-based OoD Detection)」の提案。ADE-OoDは屋内・屋外画像を含み、分布内として150のセマンティックカテゴリを定義し、多様な分布外オブジェクトを含んでいる。DOoDでは、分布内セマンティック埋め込み上にMLPを用いた拡散モデルを学習し、スコアマッチングの観点から推論時に画素単位のOoDスコアを算出する。一般的な道路シーンOoDベンチマークにおいて、DOoDは既存の最先端手法と同等またはそれ以上の性能を発揮し、分布外データを学習に用いないこと、またデータドメインに関する仮定を設けない点で優位性を示す。ADE-OoDにおいてもDOoDは従来手法を上回る性能を示すが、さらなる改善の余地が大きく残されている。