2ヶ月前

拡大と縮小:カモフラージュされた物体検出のための多スケールトリプレットネットワーク

Pang, Youwei ; Zhao, Xiaoqi ; Xiang, Tian-Zhu ; Zhang, Lihe ; Lu, Huchuan
拡大と縮小:カモフラージュされた物体検出のための多スケールトリプレットネットワーク
要約

最近提案されたカモフラージュ物体検出(COD)は、視覚的に周囲の環境に溶け込んでいる物体をセグメンテーションすることを目指しています。これは現実的な状況では非常に複雑かつ困難な課題です。カモフラージュされた物体と背景との間には高い固有の類似性があり、さらにこれらの物体はスケールが多様で、外観がぼやけており、時には深刻な遮蔽も発生します。これらの問題に対処するため、我々は人間が不明瞭な画像を観察する際の行動、つまり拡大・縮小を模倣した混合スケールトリプレットネットワークである\textbf{ZoomNet}を提案します。具体的には、ZoomNetは設計されたスケール統合ユニットと階層混合スケールユニットを用いて、候補となる物体と背景環境との間に存在する微細な手がかりを十分に探索することで、判別可能な混合スケール意味論を学習します。また、区別不能なテクスチャから派生する不確実性や曖昧性を考慮し、単純ながら効果的な正則化制約である不確実性認識損失(uncertainty-aware loss)を構築しました。これによりモデルは候補領域においてより高い信頼度で正確な予測を行うことが促されます。特別な装飾なしに、我々が提案した高タスク適合型モデルは4つの公開データセット上で既存の23種類の最先端手法を一貫して上回っています。さらにSODタスクにおける最新の最先端モデルに対する優れた性能も、我々のモデルの有効性と汎用性を証明しています。コードは\url{https://github.com/lartpang/ZoomNet}で提供される予定です。

拡大と縮小:カモフラージュされた物体検出のための多スケールトリプレットネットワーク | 最新論文 | HyperAI超神経