2ヶ月前

芸術作品中の人物検出にCNNを用いる

Nicholas Westlake; Hongping Cai; Peter Hall
芸術作品中の人物検出にCNNを用いる
要約

CNN(畳み込みニューラルネットワーク)は、写真における物体検出の性能を大幅に向上させました。しかし、美術作品における物体検出に関する研究はまだ限られています。本研究では、写真、漫画、および41種類の異なる美術運動から人物を含む挑戦的なデータセットPeople-Artにおいて最先端の性能を示しています。この高性能は、タスクに合わせてCNNを微調整することで達成されました。これにより、写真でCNNを学習させると写真に対して過学習する傾向があることも示されています:写真から美術作品への転移が可能なのは最初の3〜4層のみです。CNNの性能はこれまでで最高ですが、AP(平均精度)は60%未満であり、クロスディペクション問題に対するさらなる研究が必要であることを示唆しています。最終版はSpringerよりhttp://dx.doi.org/10.1007/978-3-319-46604-0_57で入手可能です。