2ヶ月前

物体検出のためのデータ拡張戦略の学習

Barret Zoph; Ekin D. Cubuk; Golnaz Ghiasi; Tsung-Yi Lin; Jonathon Shlens; Quoc V. Le
物体検出のためのデータ拡張戦略の学習
要約

データ拡張は深層学習モデルの訓練において重要な要素です。データ拡張が画像分類の性能を大幅に向上させることは既に示されていますが、物体検出におけるその可能性は十分に調査されていません。物体検出のために画像をアノテーションする際の追加コストを考えると、このコンピュータビジョンタスクにおいてデータ拡張はさらに重要であるかもしれません。本研究では、データ拡張が物体検出に与える影響について調査しました。まず、画像分類から借用したデータ拡張操作が検出モデルの訓練に役立つことを示しますが、その改善は限定的です。そこで、学習された専門的なデータ拡張ポリシーが検出モデルの汎化性能をどのように向上させるかを調査しました。重要な点は、これらの拡張ポリシーは訓練時のみに影響を与え、評価時には訓練済みモデルが変更されないことです。COCOデータセットでの実験結果によれば、最適化されたデータ拡張ポリシーにより検出精度が+2.3 mAP以上向上し、単一の推論モデルで50.7 mAPという最先端の精度を達成できることを示しています。また、COCOで見つけた最良のポリシーは他の検出データセットやモデルにもそのまま転用でき、予測精度を向上させることができます。例えば、COCOで特定された最良の拡張ポリシーによりPASCAL-VOCでの強力なベースラインが+2.7 mAP向上しました。当研究の結果はまた、学習された拡張ポリシーが物体検出において最先端のアーキテクチャ正則化手法よりも優れていることを明らかにしています(強力なベースラインであっても)。学習されたポリシーを使用して訓練するためのコードはオンラインで公開されており、https://github.com/tensorflow/tpu/tree/master/models/official/detection から入手できます。

物体検出のためのデータ拡張戦略の学習 | 最新論文 | HyperAI超神経