2ヶ月前
弱教師付き人物再識別:微分可能なグラフィカル学習と新しいベンチマーク
Guangrun Wang; Guangcong Wang; Xujie Zhang; Jianhuang Lai; Zhengtao Yu; Liang Lin

要約
人物再識別(Re-ID)は、既存のデータセット(例:CUHK03 [1] および Market-1501 [2])の正確なアノテーションから大きく恩恵を受けていますが、これらのデータセットの各画像に適切なラベルを付ける作業は非常にコストがかかります。本研究では、正確なアノテーションを不正確なアノテーションに置き換えることで、Re-IDのアノテーション作業を軽減します。つまり、時間に基づいて画像をグループ化し、各グループに対してバッグレベルのラベルを割り当てます。これにより、アノテーション労力が大幅に削減され、大規模なRe-IDベンチマークであるSYSU-30$k$が作成されました。新しいベンチマークには3万($30k$)人の個人が含まれており、これはCUHK03(1,300人)やMarket-1501(1,500人)の約20倍、ImageNet(1,000カテゴリ)の約30倍の規模です。総計29,606,918枚の画像が含まれています。バッグレベルのアノテーションを使用してRe-IDモデルを学習することを弱教師付きRe-ID問題と呼びます。この問題を解決するために、我々は微分可能なグラフィカルモデルを導入し、バッグ内のすべての画像からの依存関係を捉え、各人物画像に対して信頼性のある疑似ラベルを生成します。生成された疑似ラベルはさらにRe-IDモデルの学習監督に使用されます。完全教師付きRe-IDモデルと比較した場合でも、我々の手法はSYSU-30$k$および他のデータセットにおいて最先端の性能を達成しています。コード、データセット、および事前学習済みモデルは\url{https://github.com/wanggrun/SYSU-30k}で公開されます。