2ヶ月前

半教師ありドメイン汎化による物体検出の言語誘導特徴量アライメント

Sina Malakouti; Adriana Kovashka
半教師ありドメイン汎化による物体検出の言語誘導特徴量アライメント
要約

既存の物体検出におけるドメイン適応(DA)およびドメイン汎化(DG)手法は、視覚空間での特徴量のアライメントを強制しますが、物体の外観変動やシーンの複雑さなどの課題に直面しており、物体の区別や正確な検出が困難となっています。本論文では、視覚言語事前学習を探索し、言語空間を通じて特徴量のアライメントを強制することで、半教師ありドメイン汎化の問題に初めて取り組みます。我々は新しいクロスドメイン記述多尺度学習(CDDMSL)を採用し、異なるドメイン固有の特性を持つ画像の記述間で埋め込み空間での合意度を最大化することを目指しています。CDDMSLは既存手法を大幅に上回り、DG設定では11.7%、DA設定では7.5%の改善を達成しました。包括的な分析と削減実験により、我々の手法の効果が確認され、CDDMSLは物体検出タスクにおけるドメイン汎化に対する有望なアプローチとして位置づけられています。

半教師ありドメイン汎化による物体検出の言語誘導特徴量アライメント | 最新論文 | HyperAI超神経