2ヶ月前
高解像度の注目物体検出のために画像ピラミッド構造を再考する
Kim, Taehun ; Kim, Kunhee ; Lee, Joonyeong ; Cha, Dongmin ; Lee, Jiho ; Kim, Daijin

要約
注目対象検出(SOD)は最近注目を集めていますが、高解像度(HR)画像に対する研究は比較的少ないのが現状です。残念ながら、HR画像とそのピクセルレベルのアノテーションは、低解像度(LR)画像とアノテーションに比べて、より労力がかかるとともに時間もかかります。したがって、本研究ではHRデータセットを使用せずにHR予測を行うための画像ピラミッドベースのSODフレームワークである逆サリエンシーピラミッド再構築ネットワーク(InSPyReNet)を提案します。InSPyReNetは、サリエンシーマップの厳密な画像ピラミッド構造を生成するように設計されており、これによりピラミッドベースの画像ブレンドを使用して複数の結果を統合することが可能になります。HR予測のために、同一画像からLRスケールとHRスケールの2つの異なる画像ピラミッドを合成し、有効受容野(Effective Receptive Field, ERF)の差異を克服するためのピラミッドブレンド手法を設計しました。私達の公開LRおよびHR SODベンチマークにおける広範な評価は、InSPyReNetが様々なSOD指標や境界精度において最先端(State-of-the-Art, SotA)手法を超えることを示しています。