17日前

YOLOv4:オブジェクト検出における最適な速度と精度

Alexey Bochkovskiy, Chien-Yao Wang, Hong-Yuan Mark Liao
YOLOv4:オブジェクト検出における最適な速度と精度
要約

畳み込みニューラルネットワーク(CNN)の精度を向上させるために多くの特徴量が提案されている。こうした特徴量の組み合わせを大規模データセット上で実用的に検証し、その結果を理論的に裏付けることが求められている。一部の特徴量は特定のモデルや特定の問題、あるいは小規模なデータセットにのみ適用可能である一方で、バッチ正規化(batch-normalization)やリジッド接続(residual-connections)といった特徴量は、多数のモデル、タスク、データセットに普遍的に適用可能である。本研究では、Weighted-Residual-Connections(WRC)、Cross-Stage-Partial-connections(CSP)、Cross mini-Batch Normalization(CmBN)、Self-adversarial-training(SAT)、Mish活性化関数(Mish-activation)といった普遍的な特徴量を含むものと仮定する。本研究では、WRC、CSP、CmBN、SAT、Mish活性化関数、Mosaicデータ拡張、CmBN(再掲)、DropBlock正則化、CIoU損失といった新規特徴量を導入し、それらの一部を組み合わせることで、Tesla V100上で約65 FPSのリアルタイム速度でMS COCOデータセットにおいて43.5% AP(AP50: 65.7%)という最先端の性能を達成した。ソースコードは以下のURLで公開されている:https://github.com/AlexeyAB/darknet

YOLOv4:オブジェクト検出における最適な速度と精度 | 最新論文 | HyperAI超神経