VBLC:悪条件下におけるドメイン適応型セマンティックセグメンテーションのための可視性向上とロジット制約学習

通常の視覚条件下で訓練されたモデルを、悪化した環境下のターゲットドメインに一般化することは、実用システムにおいて極めて困難な課題である。従来の代表的なアプローチは、明瞭な状態と悪化した状態の画像間のドメインギャップを埋めることで、ターゲット環境下でも良好な予測を実現することである。しかし、これまでの手法は、通常状態で撮影された同一シーンの追加参照画像を前提としており、実際の現場ではこうした画像を収集することは極めて困難である。さらに、多くの手法は夜間や霧天といった単一の悪化条件に焦点を当てており、他の悪天候が複合的に発生する状況におけるモデルの汎化能力が弱まってしまうという問題がある。上記の課題を克服するため、本研究では、正常状態から悪化状態への適応をより優れた性能で実現することを目的とした新しいフレームワーク「Visibility Boosting and Logit-Constraint learning(VBLC)」を提案する。VBLCは、参照画像を必要とせずに、複数の悪化条件が同時に存在する状況を同時に処理する可能性を探索する。具体的には、画像レベルにおけるある種の事前知識を用いて、ターゲット画像の可視性を動的に向上させる「Visibility Boostモジュール」を提案する。さらに、自己学習手法における従来の交差エントロピー損失関数がもたらす過信(overconfidence)の問題に着目し、訓練中にロジット出力に制約を課す「Logit-Constraint Learning」を設計した。本研究の知見によれば、これはこのような困難なタスクに取り組む上で全く新しい視点である。Cityscapes → ACDC、およびCityscapes → FoggyCityscapes + RainCityscapesの2つの正常状態から悪化状態へのドメイン適応ベンチマークにおいて、広範な実験によりVBLCの有効性が検証され、新たな最先端(SOTA)性能を達成した。コードは以下のURLで公開されている:https://github.com/BIT-DA/VBLC。