HyperAI超神经

Zero Shot Cross Modal Retrieval

Zero-Shot Cross-Modal Retrieval 是一项旨在跨不同模态(如文本和图像)查找相关项目而无需训练示例的任务。该任务面临的主要挑战是异质性差距,即不同模态的数据类型存在本质差异,导致直接测量相似度困难。为解决这一问题,现有方法通常通过学习共享潜在表示空间来弥合异质性差距,使不同模态的数据能够投影到同一表示空间中,从而实现跨模态项目的直接相似度测量。这项技术在电子商务等领域具有重要应用价值。