
摘要
自最优传输(Self-Optimal-Transport, SOT)特征变换旨在提升数据实例的特征集,以促进下游匹配或分组相关任务。变换后的特征集编码了实例特征之间丰富的高阶关系。变换特征之间的距离不仅捕捉了它们直接的原始相似性,还反映了它们对集合中其他特征相似性的第三方共识。一个特定的最小成本最大流分数匹配问题,其熵正则化版本可以通过最优传输(Optimal Transport, OT)优化进行近似求解,从而产生了我们的导出变换,该变换具有高效性、可微性、等变性、无参数性和概率解释性。实验证明,该变换在使用上非常有效且灵活,在多种任务和训练方案中插入时能持续改进网络性能。我们通过无监督聚类问题展示了其优点,并证明了它在小样本分类中的高效性和广泛适用性,取得了最先进的结果,并在大规模人员重识别任务中表现出色。