
摘要
近年来,图像聚类技术取得了显著进步,主要得益于深度学习领域的快速发展。然而,由于深度神经网络架构的复杂性,目前尚缺乏能够从数学理论上解释深度聚类方法成功原因的理论体系。在本研究中,我们提出了一种先进的、稳定且高效的图像聚类算法——投影散射谱聚类(Projected-Scattering Spectral Clustering, PSSC),该方法不仅具备出色的性能,还具有良好的数学可解释性。PSSC引入了一种新颖的方法,用于挖掘小尺寸图像在散射变换(scattering transform)域中的几何结构特性。这一方法的灵感来源于一个关键观察:在散射变换域中,各个类别数据矩阵对应于前几个最大特征值的特征向量所张成的子空间,在不同类别之间具有高度相似性。因此,通过将这些共享子空间进行投影去除,可以显著降低类内差异性,从而大幅提升聚类效果。我们称此方法为“正交补空间投影”(Projection onto Orthogonal Complement, POC)。实验结果表明,PSSC在所有浅层聚类算法中均取得了最优性能;同时,其聚类效果与当前最先进的聚类技术相当,但执行时间却减少了超过一个数量级。秉承可复现研究(reproducible research)的理念,我们随论文一并发布了高质量的代码仓库,以促进学术交流与进一步研究。