
要約
私たちは補完的なファッション予測の問題を検討しています。既存のアプローチは、異なるカテゴリから視覚的に互いに適合するファッションアイテムがより近くなるような埋め込み空間を学習することに焦点を当てています。しかし、このようなラベル付きのコーディネートを作成することは労力が大きく、特に大規模なファッションカタログではすべての可能なコーディネート組み合わせを生成することが現実的ではありません。本研究では、大量の非ラベル付きファッションコーパスを活用して、訓練中に疑似ポジティブおよび疑似ネガティブのコーディネートを即座に作成する半教師あり学習アプローチを提案します。訓練バッチ内の各ラベル付きコーディネートについて、ラベル付きアイテムと非ラベル付きアイテムをマッチングすることで疑似コーディネートを得ます。さらに、元の画像とその変換の表現が一貫していることを確保するために一貫性正則化を導入し、自己監督を通じて色やその他の重要な属性を暗黙的に取り入れます。私たちはPolyvore、Polyvore-Dおよび新規に作成した大規模なFashion Outfitsデータセットで広範な実験を行い、提案手法が完全教師あり方法と同等の性能を示すことを示しました。これは、わずかなラベル付きサンプルのみを使用しているにもかかわらずです。