
要約
本論文の主な貢献は、追加データを収集せずに元の訓練セットのみを使用する単純な半教師付きパイプラインの提案である。この課題は、1) 訓練セットからより多くの訓練データを得る方法と 2) 新しく生成されたデータを使用する方法に難しさがある。本研究では、ジェネレーティブ・アドバーサリアル・ネットワーク(GAN)を使用してラベルなしサンプルを生成した。我々は外れ値用のラベル平滑化正則化(LSRO)を提案する。この手法は、ラベルなし画像に対して一様なラベル分布を割り当てることで、教師付きモデルを正則化し、ベースライン性能を向上させる。提案手法の有効性を実践的な問題である人物再識別(re-ID)で検証した。このタスクは、他のカメラからクエリ人物を見つけることを目指している。サンプル生成には深層畳み込みジェネレーティブ・アドバーサリアル・ネットワーク(DCGAN)を採用し、表現学習にはベースラインとなる畳み込みニューラルネットワーク(CNN)を使用した。実験結果から、GANによって生成されたデータを追加することで、学習済みCNN埋め込みの識別能力が著しく向上することが示された。大規模データセットMarket-1501, CUHK03, DukeMTMC-reIDにおいて、それぞれベースラインCNNに対するrank-1精度で+4.37%, +1.6%, +2.46%の改善が得られた。さらに、提案手法を細かい鳥類認識にも適用し、強力なベースラインに対して+0.6%の改善が達成された。コードは https://github.com/layumi/Person-reID_GAN で公開されている。以上が翻訳内容です。ご確認ください。