2ヶ月前

料理コンテキストにおけるクロスモーダル検索:意味論的なテキスト-画像埋め込みの学習

Micael Carvalho; Rémi Cadène; David Picard; Laure Soulier; Nicolas Thome; Matthieu Cord
料理コンテキストにおけるクロスモーダル検索:意味論的なテキスト-画像埋め込みの学習
要約

調理活動を支援する強力なツールの設計は、大量のデータの可用性と、それらを分析できる最近の機械学習の進歩により、急速に人気を博しています。本論文では、料理の画像とレシピなどの視覚的データと文章データを共有表現空間で対応させるクロスモーダル検索モデルを提案します。大規模問題に対処可能な効果的な学習スキームを説明し、近100万件の画像-レシピペアが含まれるRecipe1Mデータセット上でその有効性を検証しました。我々の手法が以前の最先端モデルに対してどれほど効果的であるかを示し、計算調理用途における定性的結果も提示します。

料理コンテキストにおけるクロスモーダル検索:意味論的なテキスト-画像埋め込みの学習 | 最新論文 | HyperAI超神経