ゼロショット合成画像検索

Zero-Shot Composed Image Retrieval (ZS-CIR) は、画像検索のサブタスクであり、参照画像と視覚的に類似し、相対的な説明で示された特定の変更を含む目標画像を教師なし学習で取得することを目指しています。このタスクでは、バイモーダルクエリを通じてユーザーが望む画像の特性をより正確に制御できます。一部の特徴は言語的な説明でより正確に伝えられ、他の特徴は視覚的な手段でより直感的に表現されます。

ゼロショット合成画像検索 | SOTA | HyperAI超神経