
深層ニューラルネットワークを基にした手法は、注目物体検出において重要な進展を遂げています。しかし、これらの手法は通常、低解像度($400\times400$ ピクセル以下)の入力画像に限定されています。非常に高解像度の画像における直接的な注目物体検出のために深層ニューラルネットワークを訓練する試みはほとんど行われていません。本論文では、高解像度の注目性検出を推進し、新しいデータセットである「High-Resolution Salient Object Detection (HRSOD)」を提供します。我々が知る限り、HRSOD は現在までに初めての高解像度注目性検出データセットです。また別の貢献として、グローバルな意味情報と局所的な高解像度詳細を組み合わせた新たなアプローチも提案しています。この課題に対処するために、具体的には当該アプローチは Global Semantic Network (GSN)、Local Refinement Network (LRN) および Global-Local Fusion Network (GLFN) から構成されています。GSN は全体画像のダウンサンプリングに基づいてグローバルな意味情報を抽出します。GSN の結果に基づいてガイドされ、LRN は特定の局所領域に焦点を当てて段階的に高解像度の予測を行います。さらに GLFN が提案され、空間的一貫性を強化し性能向上に寄与します。実験結果は、当方の手法が既存の最先端手法よりも大幅に優れた性能を示していることを示しており、広く使用されている注目性ベンチマークでも同等またはそれ以上の性能を達成しています。HRSOD データセットは https://github.com/yi94code/HRSOD で利用可能です。