2ヶ月前

高精度二値画像セグメンテーション

Qin, Xuebin ; Dai, Hang ; Hu, Xiaobin ; Fan, Deng-Ping ; Shao, Ling ; Van Gool, Luc
高精度二値画像セグメンテーション
要約

私たちは、自然画像から非常に正確なオブジェクトをセグメンテーションする新しいタスクである二値画像セグメンテーション(Dichotomous Image Segmentation: DIS)に関する体系的な研究を発表します。この目的のために、5,470枚の高解像度(例:2K、4K以上の解像度)画像を収集し、初めての大規模DISデータセット「DIS5K」を作成しました。このデータセットには、さまざまな背景に存在するカモフラージュされた、目立つ、または細部にわたるオブジェクトが含まれています。DISは極めて微細なラベルでアノテーションされています。さらに、特徴レベルとマスクレベルの両方のガイダンスを使用してDISモデルの学習を行う単純な中間監督基線(Intermediate Supervision Network: IS-Net)を導入します。IS-Netは提案されたDIS5Kにおいて様々な最先端の基線モデルを上回り、将来のDIS研究を促進する一般的な自己学習監督ネットワークとなっています。また、誤検出と未検出を修正するために必要なマウスクリック操作数を近似する新しい指標「人間による修正作業量(Human Correction Efforts: HCE)」を設計しました。HCEはモデルと実世界アプリケーションとのギャップを測定するために利用され、既存の指標を補完することができます。最後に、最大規模のベンチマーク評価を行い、16つの代表的なセグメンテーションモデルを評価し、オブジェクトの複雑さに関するより深い洞察を得るとともに、いくつかの潜在的な応用例(例:背景除去、アートデザイン、3D再構築)も示しています。これらの努力が学術界および産業界にとって有望な方向性を開くことを期待しています。プロジェクトページ: https://xuebinqin.github.io/dis/index.html.

高精度二値画像セグメンテーション | 最新論文 | HyperAI超神経