2ヶ月前

進行中の多タスクノイズ低減学習およびディスティリングフレームワークの 細かい車両認識への適用

Liu, Dichao
進行中の多タスクノイズ低減学習およびディスティリングフレームワークの
細かい車両認識への適用
要約

微細車両認識(FGVR)は、知能交通システムにとって重要な基本技術であるが、その固有のクラス内変動により非常に困難である。これまでのFGVRに関する研究の多くは、異なる撮影角度や位置などによって引き起こされるクラス内変動に焦点を当てている一方で、画像ノイズによって引き起こされるクラス内変動にはほとんど注目されていなかった。本論文では、画像ノイズによるクラス内変動問題を解決するために、進行的多タスクノイズ対策学習(PMAL)フレームワークと進行的多タスク蒸留(PMD)フレームワークを提案する。PMALフレームワークは、画像認識において画像デノイジングを追加タスクとして扱い、モデルに対して段階的にノイズ不変性を学習させることが高精度な認識を達成する。PMDフレームワークは、PMALで訓練されたモデルの知識を元のバックボーンネットワークに転送し、元のバックボーンネットワークよりもわずかに高い認識精度を持つモデルを生成するが、元のバックボーンネットワークに比べて追加のオーバーヘッドはない。これらの2つのフレームワークを組み合わせることで、スタンフォード・カーズとコンプカーズという2つの広く使用されている標準的なFGVRデータセットだけでなく、北京理工大学(BIT)-Vehicle, Vehicle Type Image Data 2 (VTID2), および Vehicle Images Dataset for Make Model Recognition (VIDMMR) という3つの監視画像ベースの車両タイプ分類データセットでも、追加のオーバーヘッドなしで既存の最先端手法を超える認識精度を持つモデルを得ることができた。ソースコードは https://github.com/Dichao-Liu/Anti-noise_FGVR から入手可能である。