4ヶ月前

畳み込みニューラルネットワーク

コンピュータビジョン

アプローチ／フレームワーク

コンピュータビジョン

Simonyan Karen Zisserman Andrew

概要

本研究では、大規模画像認識の文脈において、畳み込みネットワークの深さが精度に与える影響を検討する。本研究の主な貢献は、非常に小さな（3×3）畳み込みフィルタを用いたアーキテクチャを用いて、深さを段階的に増加させたネットワークの包括的な評価であり、重み層を16～19層まで深くすることで、従来の最先端手法に比べて顕著な性能向上が達成可能であることを示している。これらの知見を基に、当チームはImageNet Challenge 2014に参加し、物体位置特定（localisation）と分類（classification）の両トラックでそれぞれ1位および2位を獲得した。さらに、本研究で得られた特徴表現が他のデータセットにも良好に一般化されることを示し、それらが最先端の結果を達成していることを確認した。本研究で最も優れた性能を示した2つのConvNetモデルを公開することで、コンピュータビジョンにおける深層視覚表現のさらなる研究を促進することを目的としている。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

4ヶ月前

畳み込みニューラルネットワーク

コンピュータビジョン

アプローチ／フレームワーク

コンピュータビジョン

Simonyan Karen Zisserman Andrew

概要

本研究では、大規模画像認識の文脈において、畳み込みネットワークの深さが精度に与える影響を検討する。本研究の主な貢献は、非常に小さな（3×3）畳み込みフィルタを用いたアーキテクチャを用いて、深さを段階的に増加させたネットワークの包括的な評価であり、重み層を16～19層まで深くすることで、従来の最先端手法に比べて顕著な性能向上が達成可能であることを示している。これらの知見を基に、当チームはImageNet Challenge 2014に参加し、物体位置特定（localisation）と分類（classification）の両トラックでそれぞれ1位および2位を獲得した。さらに、本研究で得られた特徴表現が他のデータセットにも良好に一般化されることを示し、それらが最先端の結果を達成していることを確認した。本研究で最も優れた性能を示した2つのConvNetモデルを公開することで、コンピュータビジョンにおける深層視覚表現のさらなる研究を促進することを目的としている。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

大規模画像認識のための非常に深い畳み込みネットワーク | 記事 | HyperAI超神経