Command Palette
Search for a command to run...
分離された高品質な显著物体検出
分離された高品質な显著物体検出
Lv Tang Bo Li Shouhong Ding Mofei Song
概要
視覚シーンから最も特徴的な物体を発見し、位置特定するための注目物体検出(SOD)は、様々なコンピュータビジョンシステムにおいて重要な役割を果たしています。高解像度時代に突入した現在、SOD手法は新たな課題に直面しています。従来の手法の主な制限点は、低解像度で単一の回帰タスクにより注目領域の識別と正確な物体境界の推定を同時に試みていることです。この手法は、両方とも困難な問題であるにもかかわらず、それらの本質的な違いを無視しており、その結果として検出品質が低下しています。本論文では、高解像度SODタスク向けに新しい深層学習フレームワークを提案します。このフレームワークは、低解像度注目分類ネットワーク(LRSCN)と高解像度精製ネットワーク(HRRN)にタスクを分解します。LRSCNは画素レベルでの分類タスクであり、低解像度で十分な意味情報を捉え、明確な注目領域、背景領域、および不確定領域を識別することを目指しています。一方、HRRNは回帰タスクであり、不確定領域内の画素の注目値を正確に精製することで、限られたGPUメモリ内で高解像度での明瞭な物体境界を保つことを目的としています。特に注目に値するのは、不確定性を訓練プロセスに導入することで、当社のHRRNは高解像度訓練データを使用せずに高解像度精製タスクに対処できる点です。高解像度注目データセットや広く使用されている注目ベンチマークに対する多数の実験結果から、提案手法が既存の最先端手法よりも優れた性能を達成していることが示されています。