要約
本稿では、交通標識認識システム向けの深層学習アプローチを提示する。ドイツおよびベルギーの公開交通標識データセットを用いて、畳み込み層と空間変換ネットワーク(Spatial Transformer Networks: STN)を組み合わせた深層ニューラルネットワークを用いた複数の分類実験が行われた。これらの実験は、交通標識分類タスクの最先端性能を向上させるための設計を目的として、様々な要因が認識性能に与える影響を評価することを目的としている。まず、SGD、SGD-Nesterov、RMSprop、Adamなど、適応型および非適応型の確率的勾配降下法に基づく最適化アルゴリズムの性能が比較評価された。次に、主なニューラルネットワーク内の異なる位置に配置された複数のSTN構成の組み合わせについて検討が行われた。提案する畳み込みニューラルネットワークは、ドイツ交通標識認識ベンチマーク(German Traffic Sign Recognition Benchmark)において99.71%の認識率を達成し、従来の最先端手法を上回るとともに、メモリ使用量の点でもより効率的であることが示された。