Command Palette
Search for a command to run...
大規模画像認識のための非常に深い畳み込みネットワーク
大規模画像認識のための非常に深い畳み込みネットワーク
Simonyan Karen Zisserman Andrew
概要
本研究では、大規模画像認識の文脈において、畳み込みネットワークの深さが精度に与える影響を検討する。本研究の主な貢献は、非常に小さな(3×3)畳み込みフィルタを用いたアーキテクチャを用いて、深さを段階的に増加させたネットワークの包括的な評価であり、重み層を16~19層まで深くすることで、従来の最先端手法に比べて顕著な性能向上が達成可能であることを示している。これらの知見を基に、当チームはImageNet Challenge 2014に参加し、物体位置特定(localisation)と分類(classification)の両トラックでそれぞれ1位および2位を獲得した。さらに、本研究で得られた特徴表現が他のデータセットにも良好に一般化されることを示し、それらが最先端の結果を達成していることを確認した。本研究で最も優れた性能を示した2つのConvNetモデルを公開することで、コンピュータビジョンにおける深層視覚表現のさらなる研究を促進することを目的としている。