
摘要
现代数据集规模的不断增大以及获取标签信息的难度,使得半监督学习成为现代数据分析中具有重要实际意义的问题之一。本文重新审视了基于生成模型的半监督学习方法,并开发了新的模型,这些模型能够从小规模有标签数据集有效推广到大规模无标签数据集。迄今为止,生成方法要么不够灵活,要么效率低下,或者不具备可扩展性。我们展示了利用近期变分方法的进展进行近似贝叶斯推断的深度生成模型可以显著改进这些问题,使生成方法在半监督学习中具有极高的竞争力。
现代数据集规模的不断增大以及获取标签信息的难度,使得半监督学习成为现代数据分析中具有重要实际意义的问题之一。本文重新审视了基于生成模型的半监督学习方法,并开发了新的模型,这些模型能够从小规模有标签数据集有效推广到大规模无标签数据集。迄今为止,生成方法要么不够灵活,要么效率低下,或者不具备可扩展性。我们展示了利用近期变分方法的进展进行近似贝叶斯推断的深度生成模型可以显著改进这些问题,使生成方法在半监督学习中具有极高的竞争力。