HyperAIHyperAI

Command Palette

Search for a command to run...

事前学習済み拡散モデルの潜在能力を解き放つ:汎化可能な人物再識別へ

Jiachen Li Xiaojin Gong

概要

ドメイン一般化可能な再識別(Domain-Generalizable Re-ID: DG Re-ID)は、1つまたは複数のソースドメインでモデルを学習し、未観測のターゲットドメインでその性能を評価するというタスクを指し、実用的な意義から注目が高まっている。これまでに多数の手法が提案されてきたが、多くの場合、汎化可能な特徴表現を学習するために判別学習(discriminative learning)または対照学習(contrastive learning)フレームワークに依存している。しかし、こうしたアプローチはしばしば「短絡的学習(shortcut learning)」を抑制できず、最適な性能を発揮できない場合がある。本研究では、相関を意識した条件付けスキーム(correlation-aware conditioning scheme)を用いた、拡散モデルを活用した表現学習手法(Diffusion Model-Assisted Representation Learning with Correlation-Aware Conditioning: DCAC)を提案する。本手法は、事前学習済みの拡散モデルと判別的かつ対照的なRe-IDモデルを、相関を意識した条件付けスキームによって統合する。具体的には、Re-IDモデルから得られるID分類確率と学習可能なIDごとのプロンプト(prompt)の組み合わせにより、ID間の相関関係を捉えた「暗黙の知識(dark knowledge)」を拡散プロセスに注入する。同時に、拡散モデルからのフィードバックは条件付けスキームを通じてRe-IDモデルに逆伝播され、Re-ID特徴の汎化能力を効果的に向上させる。単一ソースおよび複数ソースのDG Re-IDタスクにおける広範な実験により、本手法が最先端の性能を達成することが示された。さらに包括的なアブレーションスタディを通じて、提案手法の有効性と堅牢性が検証され、その動作メカニズムに関する洞察が得られた。コードは、https://github.com/RikoLi/DCAC にて公開予定である。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています