
摘要
我们提出了一种基于池(pool-based)的主动学习框架,该框架构建于序列图卷积网络(Sequential Graph Convolutional Network, GCN)之上。在该框架中,数据池中的每张图像特征被表示为图中的一个节点,节点间的边则编码了图像之间的相似性。以少量随机采样的图像作为初始标记样本,我们通过最小化二元交叉熵损失来学习图结构的参数,从而实现对已标记节点与未标记节点的有效区分。GCN通过节点间的消息传递机制,促使强关联节点产生相似的表示。我们充分利用GCN的这一特性,选择那些与已标记样本显著不同的未标记样本进行查询。为此,我们结合图节点嵌入(node embeddings)及其置信度分数,采用如CoreSet及基于不确定性的采样策略来选择待查询节点。在每次迭代中,我们将新查询节点的标签从“未标记”更新为“已标记”,重新训练学习器以优化下游任务,并同时调整图模型以最小化其修正后的目标函数。整个过程在固定预算范围内持续进行。我们在6个不同基准数据集上对所提方法进行了评估,涵盖4个真实图像分类任务、1个基于深度信息的手部姿态估计任务以及1个合成RGB图像分类任务。实验结果表明,该方法显著优于多种具有竞争力的基线方法(如VAAL、Learning Loss、CoreSet),并在多个应用任务中达到了新的最先进性能(state-of-the-art)。相关代码实现可访问以下链接获取:https://github.com/razvancaramalau/Sequential-GCN-for-Active-Learning