2ヶ月前

変形可能な部品モデルは畳み込みニューラルネットワークである

Ross Girshick; Forrest Iandola; Trevor Darrell; Jitendra Malik
変形可能な部品モデルは畳み込みニューラルネットワークである
要約

変形可能な部品モデル(DPM)と畳み込みニューラルネットワーク(CNN)は、視覚認識のための二つの広く使用されているツールです。これらは一般的に異なるアプローチとして捉えられています:DPMはグラフィカルモデル(マルコフ随機場)、一方CNNは「ブラックボックス」非線形分類器です。本論文では、DPMをCNNとして定式化できることを示し、この二つのアイデアを新しい形で統合しています。当該構築には、DPM推論アルゴリズムを展開し、各ステップを同等(そして時折新規な)CNN層にマッピングする過程が含まれます。この観点から、DPMで通常使用される標準的な画像特徴量を学習された特徴量抽出器で置き換えることが自然になります。その結果得られるモデルをDeepPyramid DPMと呼び、PASCAL VOCにおいて実験的に検証しました。DeepPyramid DPMは、向き付き勾配のヒストグラム特徴量(HOG)に基づくDPMを大幅に上回り、最近導入されたR-CNN検出システムの同等バージョンよりもわずかに優れた性能を示すとともに、その処理速度は一桁速いことが確認されました。

変形可能な部品モデルは畳み込みニューラルネットワークである | 最新論文 | HyperAI超神経