2ヶ月前

コンピュータビジョンのためのインセプションアーキテクチャの再考

Christian Szegedy; Vincent Vanhoucke; Sergey Ioffe; Jonathon Shlens; Zbigniew Wojna
コンピュータビジョンのためのインセプションアーキテクチャの再考
要約

畳み込みネットワークは、幅広いタスクの最先端のコンピュータビジョンソリューションの中心に位置しています。2014年以降、非常に深い畳み込みネットワークが主流となり、様々なベンチマークで大幅な性能向上をもたらしました。モデルサイズと計算コストの増加が品質向上につながる傾向にある一方(十分なラベル付きデータが訓練に提供される限り)、計算効率とパラメータ数の低減は、モバイルビジョンやビッグデータシナリオなどの様々な用途において依然として重要な要素となっています。本稿では、適切に分解された畳み込みと積極的な正則化を用いて、追加された計算を可能な限り効率的に利用する方法を探ります。ILSVRC 2012分類チャレンジ検証セットでのベンチマーク結果から、我々の手法が現状の最先端に対して大幅な改善を示していることを示します:単一フレーム評価では推論あたり50億回の乗算加算演算と2500万以下のパラメータを使用して、トップ-1誤差率21.2%、トップ-5誤差率5.6%を達成しました。4つのモデルのアンサンブルとマルチクロップ評価を使用すると、検証セットでのトップ-5誤差率3.5%(テストセットでは3.6%)およびトップ-1誤差率17.3%を報告しています。

コンピュータビジョンのためのインセプションアーキテクチャの再考 | 最新論文 | HyperAI超神経