17日前
アート画像におけるオブジェクト検出の向上に向けたスタイル転送のみを用いた手法
David Kadish, Sebastian Risi, Anders Sundnes Løvlie

要約
深層学習に基づくニューラルネットワークを用いた物体検出技術は近年著しい進展を遂げているが、絵画やスケッチなどのアート画像における物体の識別には依然として困難を抱えている。この課題は「クロスデピクション問題」として知られており、その原因の一つとして、ニューラルネットワークが物体の形状よりもテクスチャの識別を優先する傾向があることが挙げられる。本論文では、アート画像における物体、特に人物の局所化を目的としたニューラルネットワークの学習プロセスを提案し、評価する。我々は、COCOデータセットの画像をAdaInスタイル転送技術を用いて変換することで、大規模な学習および検証用データセットを生成した。このデータセットを用いて、Faster R-CNNに基づく物体検出ネットワークをファインチューニングし、既存のPeople-Artテストデータセット上で評価を行った。その結果、従来の最先端技術を大幅に上回る性能が達成され、アート画像を処理するためのニューラルネットワークを学習させるための新しいデータセット構築手法が提示された。