ピクセル単位の分布外検出のための残差パターン学習:セマンティックセグメンテーションにおける応用

セマンティックセグメンテーションモデルは、既知の(「イン・ディストリビューション」)視覚クラスにピクセルを分類する。これらのモデルがオープンワールド環境で運用される場合、その信頼性は、イン・ディストリビューションのピクセルを正しく分類する能力に加えて、アウト・オブ・ディストリビューション(OoD)のピクセルを検出できるかどうかに依存する。歴史的に、これらのモデルのOoD検出性能の低さは、OoDの視覚オブジェクトを含む合成トレーニング画像を用いたモデルの再トレーニングに基づく手法の開発を促した。これらの再トレーニング手法は成功を収めたが、2つの問題を抱えている。第一に、再トレーニングの過程でイン・ディストリビューションのセグメンテーション精度が低下する可能性がある。第二に、トレーニングデータセット(例:都市環境)に限定された文脈外(例:国境周辺の環境)において、OoD検出性能の一般化能力が十分ではない。本論文では、これらの課題を以下の2つの新しいアプローチで軽減する。第一に、インライナーのセグメンテーション性能に影響を与えることなく、OoDピクセルを検出する支援を行う新しい「リジッドパターン学習(RPL)」モジュールを提案する。第二に、RPLが多様な文脈においても堅牢にOoDピクセルを検出できるよう、新たな「コンテキストロバストな対照学習(CoroCL)」を導入する。本手法は、Fishyscapes、Segment-Me-If-You-Can、RoadAnomalyの各データセットにおいて、従来の最先端技術と比較して、FPR(False Positive Rate)で約10%、AuPRC(Area Under the Precision-Recall Curve)で約7%の向上を達成した。本研究のコードは、以下のURLから公開されている:https://github.com/yyliu01/RPL。