17日前

ノイズのあるラベルを用いた人物再識別における大規模事前学習

Dengpan Fu, Dongdong Chen, Hao Yang, Jianmin Bao, Lu Yuan, Lei Zhang, Houqiang Li, Fang Wen, Dong Chen
ノイズのあるラベルを用いた人物再識別における大規模事前学習
要約

本稿は、ノイズを含むラベルを用いた人物再識別(Re-ID)の事前学習に関する問題に取り組むことを目的としている。事前学習タスクの構築にあたり、既存のラベルなしRe-IDデータセット「LUPerson」の生動画に対して、シンプルなオンラインマルチオブジェクト追跡システムを適用し、トラックレットから自動的に導出されるIDラベルを含むノイズラベルバージョン「LUPerson-NL」を構築した。これらのラベルはトラックレットから自動生成されるため、必然的にノイズを含む。これを受けて、ノイズラベルを活用する大規模な事前学習フレームワーク(PNL: Pre-training framework utilizing Noisy Labels)を提案する。本フレームワークは、教師付きRe-ID学習、プロトタイプベースの対照学習、およびラベル誘導型対照学習の3つの学習モジュールから構成されている。原則として、これらのモジュールを統合的に学習させることで、類似したサンプルを同一のプロトタイプにクラスタリングするだけでなく、プロトタイプの割り当てに基づいてノイズラベルの修正も可能となる。本研究では、生動画からの直接学習が、空間的・時間的相関を弱い教師信号として利用する観点から、事前学習の有望な代替手段であることを示した。このシンプルな事前学習タスクは、「LUPerson-NL」上で、装飾的な技術を一切用いずに、SOTA(最先端)のRe-ID表現をスケーラブルに学習可能である。例えば、同一の教師付きRe-ID手法MGNを用いた場合、本研究で提案する事前学習モデルは、CUHK03、DukeMTMC、MSMT17の各データセットにおいて、無教師事前学習の対応手法と比較してmAPをそれぞれ5.7%、2.2%、2.3%向上させた。特に小規模またはフェイショット(few-shot)設定では、性能向上がさらに顕著であり、学習された表現の優れた転移性が示唆された。コードは以下のURLで公開されている:https://github.com/DengpanFu/LUPerson-NL