
要約
多人再识别(Person Re-Identification)は、異なるカメラ間での画像スタイルの変動によって影響を受けるクロスカメラ検索タスクです。この問題は、カメラに依存しない記述子部分空間を学習することで間接的に解決されています。本論文では、この課題に明示的に取り組むために、カメラスタイル(CamStyle)適応を導入します。CamStyleは、データ拡張手法として機能し、カメラ間のスタイル差異を滑らかにします。具体的には、CycleGANを使用してラベル付き訓練画像を各カメラのスタイルに転送し、元の訓練サンプルと共に拡張された訓練セットを形成します。この方法は、過学習に対するデータの多様性を増加させる一方で、相当なレベルのノイズも引き起こします。ノイズの影響を緩和するため、ラベル平滑化正則化(Label Smooth Regularization: LSR)が採用されました。LSRなしの基本的なバージョンでも、過学習が頻繁に発生する少数カメラシステムにおいて十分な性能を示しています。LSRを使用することで、過学習の程度に関わらずすべてのシステムで一貫した改善が見られました。また、最先端技術と比較しても競争力のある精度を報告しています。以上が翻訳となります。