17日前
ドメイン汎化型セマンティックセグメンテーションのための再パラメータ化されたビジョントランスフォーマー(ReVT)
Jan-Aike Termöhlen, Timo Bartels, Tim Fingscheidt

要約
意味分割のタスクは、画像の各ピクセルに意味的ラベルを割り当てるモデルの能力を要する。しかし、学習ドメインとは異なるデータ分布を持つ未知のドメインにモデルを展開した場合、その性能は著しく低下する。本研究では、学習後の複数モデルの重み平均を用いた再パラメータ化されたビジョントランスフォーマー(ReVT)を活用し、増強駆動型のドメイン一般化手法を提案する。我々の手法は、複数のベンチマークデータセット上で評価され、小型モデルでは47.3%(先行研究:46.3%)、中型モデルでは50.1%(先行研究:47.8%)という、現時点で最も高いmIoUスコアを達成した。同時に、先行研究の最良手法と比較してパラメータ数が少なく、推論時のフレームレートも高い。また、実装が容易であり、ネットワークアンサンブルとは異なり、推論時に追加の計算負荷を生じないという利点を持つ。