2ヶ月前

隠された物体の検出

Fan, Deng-Ping ; Ji, Ge-Peng ; Cheng, Ming-Ming ; Shao, Ling
隠された物体の検出
要約

我々は、隠された物体検出(Concealed Object Detection: COD)に関する最初の体系的な研究を発表します。この研究の目的は、背景に「完全に」埋め込まれた物体を識別することです。隠された物体と背景との間の高い内在的類似性により、CODは従来の物体検出やセグメンテーションよりも遥かに困難な課題となっています。このタスクをより深く理解するために、我々は大規模なデータセットであるCOD10Kを収集しました。このデータセットには、78の物体カテゴリから多様な実世界シナリオで隠された10,000枚の画像が含まれています。さらに、我々は豊富なアノテーションを提供しており、これには物体カテゴリ、物体境界、難易度属性、オブジェクトレベルのラベル、インスタンスレベルのアノテーションが含まれます。当該COD10Kは現在まで最大規模のCODデータセットであり、最も豊富なアノテーションを持つことで包括的な隠された物体理解を可能にし、さらには検出、セグメンテーション、分類などの他の視覚タスクの進歩にも利用できる可能性があります。野生での動物の狩猟方法に着想を得て、我々は単純ながら強力なCOD用ベースラインモデルであるSearch Identification Network(SINet)を設計しました。特別な工夫なしでもSINetはすべてのテストデータセットにおいて12つの最先端ベースラインモデルを上回り、堅牢で汎用的なアーキテクチャとなり得ることから、今後のCOD研究における触媒として機能する可能性があります。最後に、いくつか興味深い知見を提示するとともに潜在的な応用例や将来の方向性についても強調します。新しい分野での研究を促進するため、プロジェクトページ(http://mmcheng.net/cod)にてコード、データセットおよびオンラインデモを利用可能です。

隠された物体の検出 | 最新論文 | HyperAI超神経