
摘要
我们提出了一种新颖的方法,通过将二值分配建模为随机变量,以优化图的比率割(ratio-cut)。该方法给出了期望比率割的上界,以及其梯度的无偏估计,从而可在在线学习场景下有效学习分配变量的参数。基于概率建模的聚类方法(PRCut)在性能上优于组合优化问题的瑞利商松弛方法、其在线学习扩展版本,以及多种广泛使用的聚类方法。我们进一步证明,PRCut聚类结果与相似性度量高度一致,并在提供基于标签的相似性信息时,其性能可媲美监督分类器。该方法能够直接利用现成的自监督表征,实现具有竞争力的聚类性能,同时可作为评估此类表征质量的有效评价工具。