
要約
私たちはどのようにして2つ以上の衣類が互いに適合しているか、または視覚的に魅力的であるかを判断するのでしょうか?その答えの一部は視覚美学の理解にあり、また個人の好みが社会的な態度、時代、場所によって形成されることで偏ります。本研究では、2つのアイテム間の適合性を予測する方法を提案します。この方法は、アイテムの視覚的特徴だけでなく、そのコンテキストにも基づいています。ここでのコンテキストとは、各アイテムと既知で適合している製品群を指します。当モデルは、アイテム特徴量間のペアワイズ比較のみに依存する他の計量学習アプローチとは対照的です。我々はグラフニューラルネットワークを使用して、コンテキストに基づいた製品埋め込み(embedding)を生成することを学習することで、適合性予測問題に取り組んでいます。2つの予測タスク(穴埋めとコーディネート適合性)についてPolyvoreおよびFashion-Genの2つのファッションデータセットとAmazonデータセットのサブセットでテストを行い、コンテキスト情報を使用した場合に最先端の結果を得ることを示しています。さらに、より多くのコンテキストを使用することでテスト性能が向上することも示しています。