2ヶ月前
弱教師付きカスケード畳み込みニューラルネットワーク
Ali Diba; Vivek Sharma; Ali Pazandeh; Hamed Pirsiavash; Luc Van Gool

要約
物体検出は視覚理解分野における難問であり、特に監督が弱い場合にはさらに困難となる。最近、高価な人間のアノテーションを必要とせずにこの課題に対処する有望な深層ニューラルネットワークの手法が提案されている。本研究では、そのような条件下で畳み込みニューラルネットワーク(CNN)を学習するために、カスケード型ネットワークの新しいアーキテクチャを提案する。具体的には、2段階または3段階のカスケード型アーキテクチャを導入し、これらはエンドツーエンドのパイプラインで訓練される。両方のアー�キテクチャの最初の段階では、完全畳み込みネットワークを訓練することでクラス固有の領域提案候補の中から最良のものを抽出する。3段階アーキテクチャの場合、中間段階では最初の段階からの活性化マップの出力を用いて物体セグメンテーションを行う。両方のアーキテクチャの最終段階は、前段階(複数段階の場合)で抽出された提案に対して多重インスタンス学習を行う畳み込みニューラルネットワークの一環である。PASCAL VOC 2007, 2010, 2012および大規模物体データセットILSVRC 2013, 2014での実験結果は、弱い教師あり物体検出、分類および位置特定において改善が見られたことを示している。