17日前
効率的な自己アンサンブルによるセマンティックセグメンテーション
Walid Bousselham, Guillaume Thibault, Lucas Pagano, Archana Machireddy, Joe Gray, Young Hwan Chang, Xubo Song

要約
アンサンブル予測は、個々の予測を別々に実行する場合よりも優れた性能を発揮することが知られている。しかし、セマンティックセグメンテーションなど、計算リソースを大量に要するタスクでは、個別に訓練が必要な複数の学習器をアンサンブル化することは現実的ではない。本研究では、アンサンブル手法がもたらす性能向上を活用しつつ、従来のアンサンブルにおける重い訓練コストを回避するアプローチを提案する。本研究で提案するセルフアンサンブル法は、特徴ピラミッドネットワーク(Feature Pyramid Network)によって生成されるマルチスケール特徴量を用い、独立したデコーダに供給することで、単一のモデル内にアンサンブルを構築する。アンサンブルと同様に、最終的な予測は各学習器が出力する予測の集約によって得られる。従来の手法とは異なり、本モデルはエンドツーエンドで訓練可能であり、アンサンブルの従来の煩雑なマルチステージ訓練を軽減する。本手法は、セマンティックセグメンテーションのベンチマークデータセットであるPascal ContextおよびCOCO-Stuff-10Kにおいて、現在の最先端技術を上回る性能を達成しており、ADE20KおよびCityscapesにおいても競争力のある結果を示している。コードはGitHub(github.com/WalBouss/SenFormer)で公開されている。