伪标记是训练模型时给未标记数据加入预测标签的操作,其解决了数据未被标记的问题,还可与标签数据一起训练半监督学习模型。
伪标记流程示意图如下:
首先,在标签数据上训练模型,后使用经过训练的模型预测无标签数据的标签,进而创建伪标签,之后,将标签数据和新生成的伪标签数据整合,并作为新的训练数据使用。