Command Palette
Search for a command to run...
InfoSeg:相互情報最大化を用いた教師なしセマンティック画像分割
InfoSeg:相互情報最大化を用いた教師なしセマンティック画像分割
Robert Harb Patrick Knöbelreiter
概要
本稿では、局所的およびグローバルな高レベル画像特徴間の相互情報量を最大化することを目的とした、教師なし意味画像セグメンテーションの新たな手法を提案する。本研究の核心的なアイデアは、近年の自己教師付き画像表現学習の進展を活用することにある。従来の表現学習手法は、画像全体を捉える単一の高レベル特徴を計算するが、本手法では、それぞれが特定の意味的クラスに対応する画像領域を捉える複数の高レベル特徴を計算する。この目的を達成するために、セグメンテーションと相互情報量最大化の2段階学習手順を提案する。第一段階では、局所的特徴とグローバル特徴に基づいて画像をセグメンテーションする。第二段階では、各局所特徴とその対応するクラスの高レベル特徴間の相互情報量を最大化する。学習にあたっては、ラベルなし画像のみを用い、ネットワークの初期化はランダムから開始する。定量的および定性的評価には既存のベンチマークおよび新たに本論文で導入する挑戦的な新ベンチマークであるCOCO-Personsを用いる。実験結果から、InfoSegは現在の最先端手法を大きく上回り、特にCOCO-Stuffデータセットにおいてピクセル精度(Pixel Accuracy)指標で26%の相対的な向上を達成した。