HyperAIHyperAI超神経
ホームニュース論文チュートリアルデータセット百科事典SOTALLMモデルGPU ランキング学会
検索
サイトについて
日本語
HyperAIHyperAI超神経
  1. ホーム
  2. SOTA
  3. クロスモーダル検索
  4. Cross Modal Retrieval On Recipe1M

Cross Modal Retrieval On Recipe1M

評価指標

Image-to-text R@1
Text-to-image R@1

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

モデル名
Image-to-text R@1
Text-to-image R@1
Paper TitleRepository
VLPCook73.674.7Vision and Structured-Language Pretraining for Cross-Modal Food Retrieval
X-MRS6463.9Cross-Modal Retrieval and Synthesis (X-MRS): Closing the Modality Gap in Shared Representation Learning-
H-T60.060.3Revamping Cross-Modal Recipe Retrieval with Hierarchical Transformers and Self-supervised Learning
AdaMine39.840.2Cross-Modal Retrieval in the Cooking Context: Learning Semantic Text-Image Embeddings
SCAN54.054.9Cross-Modal Food Retrieval: Learning a Joint Embedding of Food Images and Recipes with Semantic Consistency and Attention Mechanism-
ACME51.852.8Learning Cross-Modal Embeddings with Adversarial Networks for Cooking Recipes and Food Images
T-Food (CLIP)72.372.6Transformer Decoders with MultiModal Regularization for Cross-Modal Food Retrieval
T-Food68.268.3Transformer Decoders with MultiModal Regularization for Cross-Modal Food Retrieval
VLPCook (R1M+)74.975.6Vision and Structured-Language Pretraining for Cross-Modal Food Retrieval
0 of 9 row(s) selected.
HyperAI

学習、理解、実践、コミュニティと共に人工知能の未来を構築する

日本語

サイトについて

私たちについてデータセットヘルプ

プロダクト

ニュースチュートリアルデータセット百科事典

リンク

TVM 中国語Apache TVMOpenBayes

© HyperAI超神経

TwitterBilibili