12日前

インテラクティブオブジェクトセグメンテーションにおけるインサイドアウトサイドガイドランス

{ Yao Zhao, Shikui Wei, Yunchao Wei, Jun Hao Liew, Shiyin Zhang}
インテラクティブオブジェクトセグメンテーションにおけるインサイドアウトサイドガイドランス
要約

本稿では、人間の操作コストを最小限に抑えつつ、正確なオブジェクトセグメンテーションマスクを取得する方法について検討する。これを実現するために、本研究では「インサイド・アウトサイド・ガイドランス(Inside-Outside Guidance, IOG)」というアプローチを提案する。具体的には、対象オブジェクトの中心付近にクリックされた「インサイド点」と、そのオブジェクトを厳密に囲むバウンディングボックスの対称的な角位置(左上・右下、または右上・左下)に配置された2つの「アウトサイド点」を用いる。これにより、セグメンテーションに向けた合計で1つの前景クリックと4つの背景クリックが実現される。本IOGの利点は以下の4点に集約される:1)2つのアウトサイド点により、他のオブジェクトや背景からの干渉を効果的に除去できる;2)インサイド点によってバウンディングボックス内に存在する関係のない領域を排除できる;3)インサイド点とアウトサイド点は直感的に識別可能であり、従来の最先端手法DEXTRが極端なサンプルをラベリングする際に生じる混乱を低減できる;4)本手法は追加のクリックによる修正を自然にサポートする。このシンプルな設計にもかかわらず、IOGは複数の代表的なベンチマークにおいて最先端の性能を達成するとともに、微調整なしに街路シーン、航空画像、医療画像など異なるドメイン間で強力な汎化能力を示している。さらに、本研究では、ImageNetやOpen Imagesなど既存のデータセットに含まれるオフ・ザ・シェル(off-the-shelf)のバウンディングボックスを用いて、高品質なインスタンスセグメンテーションマスクを生成可能なシンプルな二段階アプローチも提案している。これにより、IOGが注釈ツールとして優れた実用性を有していることが示された。

インテラクティブオブジェクトセグメンテーションにおけるインサイドアウトサイドガイドランス | 最新論文 | HyperAI超神経