摘要
本文研究了不完全多视图聚类分析中的两个关键挑战性问题:其一,如何在无标签辅助的情况下,学习到不同视图间具有信息量且一致的表示;其二,如何从数据中恢复缺失的视图。为此,我们提出了一种新颖的目标函数,从信息论的角度将表示学习与数据恢复统一纳入一个框架之中。具体而言,通过对比学习最大化不同视图之间的互信息,以学习具有信息量且一致的表示;同时,通过双预测机制最小化不同视图的条件熵,实现缺失视图的恢复。据我们所知,这是首个提供理论框架、统一建模一致表示学习与跨视图数据恢复的开创性工作。大量实验结果表明,所提出的方法在四个具有挑战性的数据集上显著优于10种先进的多视图聚类方法。代码已公开,获取地址为:https://pengxi.me。