
摘要
我们提出一个兼具实用性与挑战性的新问题:通用部分标签学习(General Partial Label Learning, GPLL)。相较于传统的部分标签学习(Partial Label Learning, PLL)问题,GPLL将监督假设从实例级——即一个标签集合部分标注一个实例——放宽至组级:1)一个标签集合部分标注一组实例,且组内实例与标签之间的关联标注信息缺失;2)允许组间关联——某一组中的实例可能部分关联到另一组的标签集合。这种模糊的组级监督机制在现实场景中更具实用性,因为不再需要对实例级进行额外标注。例如,在视频中的人脸命名任务中,一组实例即为某一帧中的所有人脸,其标签由对应字幕中的名称集合提供。本文提出一种新型图卷积网络(Graph Convolutional Network, GCN),称为双二分图自编码器(Dual Bipartite Graph Autoencoder, DB-GAE),以应对GPLL中的标签模糊性挑战。首先,我们利用组间相关性,将实例组建模为双二分图结构:组内二分图与组间二分图,二者相互补充,有效缓解标签关联的歧义问题。其次,我们设计了一种GCN自编码器对这两种图结构进行编码与解码,其中解码结果被视为经过优化的预测结果。值得注意的是,DB-GAE为自监督且归纳式(transductive)学习方法,仅依赖组级监督信息,无需独立的离线训练阶段。在两个真实世界数据集上的大量实验表明,DB-GAE在F1分数上相比最优基线方法绝对提升0.159,在准确率上提升24.8%。此外,本文还从多个层次对标签模糊性进行了深入分析,验证了所提方法的鲁棒性与有效性。