8日前

事前学習済み拡散モデルの潜在能力を解き放つ：汎化可能な人物再識別へ

Jiachen Li, Xiaojin Gong

要約

ドメイン一般化可能な再識別（Domain-Generalizable Re-ID: DG Re-ID）は、1つまたは複数のソースドメインでモデルを学習し、未観測のターゲットドメインでその性能を評価するというタスクを指し、実用的な意義から注目が高まっている。これまでに多数の手法が提案されてきたが、多くの場合、汎化可能な特徴表現を学習するために判別学習（discriminative learning）または対照学習（contrastive learning）フレームワークに依存している。しかし、こうしたアプローチはしばしば「短絡的学習（shortcut learning）」を抑制できず、最適な性能を発揮できない場合がある。本研究では、相関を意識した条件付けスキーム（correlation-aware conditioning scheme）を用いた、拡散モデルを活用した表現学習手法（Diffusion Model-Assisted Representation Learning with Correlation-Aware Conditioning: DCAC）を提案する。本手法は、事前学習済みの拡散モデルと判別的かつ対照的なRe-IDモデルを、相関を意識した条件付けスキームによって統合する。具体的には、Re-IDモデルから得られるID分類確率と学習可能なIDごとのプロンプト（prompt）の組み合わせにより、ID間の相関関係を捉えた「暗黙の知識（dark knowledge）」を拡散プロセスに注入する。同時に、拡散モデルからのフィードバックは条件付けスキームを通じてRe-IDモデルに逆伝播され、Re-ID特徴の汎化能力を効果的に向上させる。単一ソースおよび複数ソースのDG Re-IDタスクにおける広範な実験により、本手法が最先端の性能を達成することが示された。さらに包括的なアブレーションスタディを通じて、提案手法の有効性と堅牢性が検証され、その動作メカニズムに関する洞察が得られた。コードは、https://github.com/RikoLi/DCAC にて公開予定である。