17日前
Waymo Open Dataset Challenge 2位受賞ソリューション —— 実時間2次元オブジェクト検出
Yueming Zhang, Xiaolin Song, Bing Bai, Tengfei Xing, Chao Liu, Xin Gao, Zhihui Wang, Yawei Wen, Haojin Liao, Guoshan Zhang, Pengfei Xu

要約
自動運転システムにおいて、画像から車両、歩行者、自転車を正確に認識することは不可欠である。予測精度の高さに加え、リアルタイム処理の要件が畳み込みニューラルネットワーク(CNN)モデルに新たな課題をもたらしている。本報告では、画像から2次元物体をリアルタイムで検出する手法を紹介する。複数の代表的な1段階型物体検出器を統合し、異なる入力戦略に基づいて個別にモデルを学習することで、特に小型物体に対する高精度なマルチスケール検出性能を向上させた。モデルの高速化のため、推論時間の最適化にTensorRTを活用した。Waymo Open Dataset Challengesのリアルタイム2D検出トラックにおいて、本研究で提案する検出フレームワークは、L1 mAP 75.00%、L2 mAP 69.72%の成績を達成し、リーダーボードで第2位を記録した。また、Nvidia Tesla V100 GPU上で45.8ms/フレームの遅延を実現し、リアルタイム処理の要件を満たしている。