深層ニューラルネットワークの交通標識検出システムにおける評価
交通標識検出システムは、自動運転やドライバーの安全・支援といった近年注目される実世界応用分野における重要な構成要素である。本論文では、Faster R-CNN、R-FCN、SSD、YOLO V2 といった複数の物体検出モデルと、Resnet V1 50、Resnet V1 101、Inception V2、Inception Resnet V2、Mobilenet V1、Darknet-19 といったさまざまな特徴抽出器を組み合わせた、各開発者によって事前に構築されたモデルの最新技術状況を分析する。本研究の目的は、転移学習を用いて交通標識検出という特定の問題領域に適合・改良されたこれらの物体検出モデルの特性を明らかにすることにある。特に、Microsoft COCOデータセットで事前学習された公開可能な物体検出モデルを、ドイツ交通標識検出ベンチマーク(German Traffic Sign Detection Benchmark: GTSD)データセット上で微調整(fine-tuning)し、その性能を評価・比較する。評価項目には、平均平均精度(mean average precision, mAP)、メモリ使用量、実行時間、浮動小数点演算回数、モデルパラメータ数、および交通標識画像サイズの影響が含まれる。その結果、Faster R-CNN Inception Resnet V2が最も高いmAPを達成した一方で、R-FCN Resnet 101は精度と実行時間のバランスにおいて最良のトレードオフを示した。また、YOLO V2 と SSD Mobilenet は特に注目すべき成果を上げており、前者は競争力ある精度を実現し、実行速度では2番目に速かった。後者であるSSD Mobilenetは、最も高速かつメモリ消費量が最小のモデルであり、モバイルおよび組み込みデバイスへの展開に最適な選択肢であることが明らかになった。