17日前

畳み込みニューラルネットワークにおける構成技術のパフォーマンス向上の複合化

Jungkyu Lee, Taeryun Won, Tae Kwan Lee, Hyemin Lee, Geonmo Gu, Kiho Hong
畳み込みニューラルネットワークにおける構成技術のパフォーマンス向上の複合化
要約

近年の画像分類に関する研究では、畳み込みニューラルネットワーク(CNN)の性能を向上させる多様な技術が提示されている。しかし、既存の技術を組み合わせて実用的なモデルを構築しようとする試みは依然として稀である。本研究では、広範な実験を通じて、これらの技術を慎重に統合し、基本的なCNNモデル(例:ResNetやMobileNet)に適用することで、処理速度の低下を最小限に抑えつつ、モデルの精度および耐障害性を向上させられることを検証した。提案する統合型ResNet-50は、ILSVRC2012検証セットにおいて、トップ-1精度を76.3%から82.78%まで向上させ、mCE(平均誤分類率)を76.0%から48.9%、mFR(平均誤検出率)を57.7%から32.3%まで改善した。これらの性能向上に伴い、推論スループットは536から312に低下するにとどまった。トランスファー学習、細分化分類、画像検索といったタスクにおいて、複数の公開データセットを用いた評価により、バックボーンネットワークの性能向上がトランスファー学習性能を顕著に改善することを確認した。本手法は、CVPR 2019におけるiFoodコンペティションの細分化視覚認識部門で1位を獲得した。実装コードおよび学習済みモデルは、https://github.com/clovaai/assembled-cnn にて公開されている。

畳み込みニューラルネットワークにおける構成技術のパフォーマンス向上の複合化 | 最新論文 | HyperAI超神経