11日前

自己教師付き画像セグメンテーション:相互情報量最大化と敵対的正則化による手法

S. Ehsan Mirsadeghi, Ali Royat, Hamid Rezatofighi
自己教師付き画像セグメンテーション:相互情報量最大化と敵対的正則化による手法
要約

意味分割は自律エージェントにとって基本的でありながらも重要なシーン理解タスクの一つである。近年、教師あり機械学習およびニューラルネットワークの発展により、このタスクにおける最先端技術の性能は著しく向上している。しかしながら、その優れた性能は大規模なアノテーション付きデータセットの可用性に強く依存している。本論文では、情報最大化と敵対的正則化を組み合わせた完全無監督意味分割手法である「InMARS(Information Maximization and Adversarial Regularization Segmentation)」を提案する。人間の知覚が個々のピクセルを個別に分析するのではなく、シーンを知覚的グループに分割するという知覚メカニズムに着想を得て、本手法はまず入力画像を意味のある領域(スーパーピクセルと呼ばれる)に分割する。次に、相互情報量最大化に基づくクラスタリングと敵対的学習戦略を用いて、これらの領域を意味的に意味のあるクラスに分類する。敵対的学習スキームを本問題に適合させるために、光度的および幾何的不変性を深層ニューラルネットワークに課すために、敵対的ピクセルノイズと空間的摂動を組み合わせている。実験の結果、本手法は一般的に用いられる2つの無監督意味分割データセット、COCO-StuffおよびPotsdamにおいて、最先端の性能を達成したことが示された。

自己教師付き画像セグメンテーション:相互情報量最大化と敵対的正則化による手法 | 最新論文 | HyperAI超神経