17日前

RepVGG:VGGスタイルConvNetを再び優れたものに

Xiaohan Ding, Xiangyu Zhang, Ningning Ma, Jungong Han, Guiguang Ding, Jian Sun
RepVGG:VGGスタイルConvNetを再び優れたものに
要約

我々は、シンプルでありながら強力な畳み込みニューラルネットワークのアーキテクチャを提案する。このモデルの推論時構造は、3×3畳み込み層とReLU関数を積み重ねた構成を持つVGGに類似した形を採用しているが、学習時におけるモデルはマルチブランチ構造を有している。この学習時と推論時のアーキテクチャを分離する手法は、構造的再パラメータ化(structural re-parameterization)技術によって実現されており、その名前をもってRepVGGと命名している。ImageNetデータセットにおいて、RepVGGは80%を超えるトップ1精度を達成しており、本研究の知見によれば、これは平滑な(plain)モデルで初めての成果である。NVIDIA GeForce 1080Ti GPU上で実行した場合、RepVGGはResNet-50に比べて83%高速、ResNet-101に比べて101%高速でありながら、より高い精度を維持しており、EfficientNetやRegNetなどの最先端モデルと比較しても、精度と速度のトレードオフにおいて優れた性能を示している。本モデルのコードおよび学習済みモデルは、https://github.com/megvii-model/RepVGG にて公開されている。

RepVGG:VGGスタイルConvNetを再び優れたものに | 最新論文 | HyperAI超神経