
要約
本論文では、物体検出のための高速領域ベースの畳み込みニューラルネットワーク手法(Fast R-CNN)を提案する。Fast R-CNNは、深層畳み込みネットワークを使用して物体提案を効率的に分類する前の研究を基にしている。以前の研究と比較して、Fast R-CNNは訓練とテストの速度を向上させつつ、検出精度も高めるためにいくつかの革新を採用している。VGG16ネットワークの訓練において、Fast R-CNNはR-CNNよりも9倍速く、テスト時には213倍速く、PASCAL VOC 2012でのmAP(平均精度)も高い結果を達成している。SPPnetと比較すると、Fast R-CNNはVGG16の訓練で3倍速く、テストでは10倍速く、より正確である。Fast R-CNNはPythonとC++(Caffeを使用)で実装されており、オープンソースのMITライセンスのもとでhttps://github.com/rbgirshick/fast-rcnnから利用可能である。