Image Text Matching
图像-文本匹配是跨模态检索(CMR)的一个子任务,旨在建立图像与相应文本描述之间的关联。其目标是在给定文本查询时检索相关图像,或在给定图像查询时检索相应的文本描述。该任务因图像和文本数据表示之间的异质性差距而具有挑战性,广泛应用于基于内容的图像搜索、视觉问答和多模态摘要等场景。
图像-文本匹配是跨模态检索(CMR)的一个子任务,旨在建立图像与相应文本描述之间的关联。其目标是在给定文本查询时检索相关图像,或在给定图像查询时检索相应的文本描述。该任务因图像和文本数据表示之间的异质性差距而具有挑战性,广泛应用于基于内容的图像搜索、视觉问答和多模态摘要等场景。