2ヶ月前
SwiDeN : 描写不変物体認識のための畳み込みニューラルネットワーク
Sarvadevabhatla, Ravi Kiran ; Surya, Shiv ; Kruthiventi, Srinivas S S ; R, Venkatesh Babu

要約
最新の物体認識アーキテクチャは印象的な性能を達成していますが、通常は特定の描画スタイル(例えば、写真のみ、スケッチのみ)に特化されています。本論文では、SwiDeN:当社の畳み込みニューラルネットワーク(CNN)アーキテクチャを紹介します。このアーキテクチャは、物体が視覚的にどのように表現されているかに関わらず(線画、リアリスティックな陰影画、写真など)、物体を認識することができます。SwiDeNでは、描画スタイルに基づく新しい「深層」切り替えメカニズムを利用しており、問題の描画固有および描画不変の側面を適切に対処しています。私たちは50カテゴリのPhoto-Artデータセットを使用し、複数のスタイルで表現された物体についてSwiDeNと他のアーキテクチャや先行研究との比較を行いました。実験結果は、SwiDeNが描画不変の物体認識問題において他の手法を上回っていることを示しています。