8日前

T-YOLO:YOLOおよびマルチスケール畳み込みニューラルネットワークを用いた小型車両検出

{Domenec Puig, Miguel Ángel García, Hatem RashwanHatem Rashwan, Daniel Padilla Carrasco}
要約

スマートシティのさまざまな応用において実世界の問題を解決するためには、深層ニューラルネットワーク(Deep Neural Network)を用いた駐車場の空き状況検出など、ネットワークの微調整(fine-tuning)が不可欠である。大規模な駐車場においては、1台のカメラで全体または大規模な駐車区域を監視できるように、高所に設置されたセンタープレーンカメラ(central-plane camera)の利用が望ましい。現在、YOLOをはじめとする主流の物体検出モデルは、リアルタイム速度で良好な精度を達成している。しかし、COCOやImageNetといった汎用データセットとは異なる独自のデータを用いる場合、性能向上の余地は非常に大きい。本論文では、YOLO-v5アーキテクチャをもとに、改良されたながらも軽量な深層物体検出モデルを提案する。本モデルは、大・小・超小サイズの物体すべてを検出可能である。特に、複数スケールの特徴表現を学習し、シーン内(本研究では車両)の物体検出に最も適したスケールを自動的に決定するマルチスケール機構の導入を提案する。この提案するマルチスケールモジュールは、元のYOLO-v5アーキテクチャと比較して、学習可能なパラメータ数を削減している。実験結果によれば、精度は大幅に向上している。実際、実験結果から明らかになったように、YOLO-v5-Sの728万パラメータから本モデルでは726万パラメータへとわずかに減少している。さらに、YOLO-v5-L/Xプロファイルと比較して、検出速度を30fpsまで低下させることに成功した。また、超小サイズの車両検出性能はYOLO-v5-Xプロファイルと比較して、33%の顕著な向上を達成した。

T-YOLO:YOLOおよびマルチスケール畳み込みニューラルネットワークを用いた小型車両検出 | 最新論文 | HyperAI超神経