
要約
本論文では、ディープラーニングを用いたロゴ認識の手法を提案します。我々の認識パイプラインは、ロゴ領域の提案に続き、ロゴ分類のために特別に訓練された畳み込みニューラルネットワーク(CNN)で構成されています。ロゴが正確に位置特定されていない場合でも対応可能です。実験はFlickrLogos-32データベース上で行われ、合成データと実際のデータ拡張、および画像前処理が認識性能に及ぼす影響を評価しました。さらに、クラスバランス調整、サンプルウェイティング、背景クラス(つまり、ロゴがない領域)の明示的なモデリングなどの異なる訓練選択肢による利点を系統的に調査しました。実験結果は、提案手法の実現可能性を確認し、既存の最先端手法を上回ることが示されました。