8日前
BiMaL:意味的シーンセグメンテーションにおけるドメイン適応のための双射的最大尤度アプローチ
Thanh-Dat Truong, Chi Nhan Duong, Ngan Le, Son Lam Phung, Chase Rainwater, Khoa Luu

要約
セマンティックセグメンテーションは、画素単位のラベルを予測することを目的としており、さまざまなコンピュータビジョン応用において重要なタスクとして注目されている。従来の完全教師ありセグメンテーション手法は、大規模な視覚データセットにおいて高い精度を達成しているが、新しいテスト環境や新しいドメインへの一般化能力に欠けるという課題がある。本研究では、まず、新たなターゲットドメインにおける学習モデルの効率を、教師なしの枠組みで評価可能な「非対応ドメインスコア(Un-aligned Domain Score)」を導入する。次に、画素の独立性に関するいかなる仮定も必要としない、敵対的エントロピー最小化の一般化形態である「双射最尤推定(Bijective Maximum Likelihood: BiMaL)損失」を提案する。本研究で提案するBiMaLは、2つの異なるドメインにおいて評価された結果、実験的に「SYNTHIA to Cityscapes」「GTA5 to Cityscapes」「SYNTHIA to Vistas」という設定において、従来の最先端(SOTA)手法を一貫して上回る性能を示した。