Semi-Supervised Learning mit tiefen generativen Modellen

Die ständig wachsende Größe moderner Datensätze in Kombination mit der Schwierigkeit, Kennzeichnungen (Labels) zu erhalten, hat das semi-überwachte Lernen zu einem Problem von erheblicher praktischer Bedeutung in der modernen Datenanalyse gemacht. Wir untersuchen den Ansatz des semi-überwachten Lernens mit generativen Modellen und entwickeln neue Modelle, die eine effektive Generalisierung von kleinen gekennzeichneten (labelled) auf große unkennzeichnete (unlabelled) Datensätze ermöglichen. Bisher waren generative Ansätze entweder unflexibel, ineffizient oder nicht skalierbar. Wir zeigen, dass tiefgreifende generative Modelle und approximative bayesianische Inferenz, die jüngste Fortschritte in variationellen Methoden nutzen, zu erheblichen Verbesserungen führen können und generative Ansätze für das semi-überwachte Lernen hoch konkurrenzfähig machen.请注意,这里“法语读者”应为“德语读者”,因此在优化句子结构时,已考虑德语读者的阅读习惯。