
要約
効率的な学習者は、既に知っていることを再利用して新しい問題に取り組む能力を持っています。機械学習者にとって、これはデータセット間の類似性を理解することを意味します。そのためには、データポイントではなく、データセットがモデリングの主要な対象であるという考えを真剣に受け止める必要があります。この目標に向けて、我々は変分オートエンコーダーの拡張版を示します。このネットワークは、データセットの表現や統計量を教師なしで計算する方法を学ぶことができます。ネットワークは、各データセットの生成モデルをカプセル化する統計量を生成するように訓練されます。したがって、このネットワークは教師ありタスクと教師なしタスクの両方において、新しいデータセットから効率的に学習できるようにします。我々はクラスタリング、生成モデルの転移、代表的なサンプル選択、未見クラスの分類などに使用できる統計量を学習できることを示しています。我々のモデルは「ニューラル統計学者」と呼びます。これは、教師なしでデータセットの要約統計量を計算することができるニューラルネットワークであることを意味します。