
摘要
对集合结构数据(如点云)进行生成建模,需要在多个尺度上对局部与全局结构进行推理。然而,将适用于普通序列数据的多尺度框架直接应用于集合结构数据具有挑战性,因为该模型必须对元素的排列保持不变性。本文提出SetVAE,一种用于集合的分层变分自编码器。受近期集合编码研究进展的启发,我们基于注意力模块构建SetVAE,该模块首先对集合进行划分,并将划分结果映射回原始基数。利用这一模块,我们的分层变分自编码器能够在多个尺度上学习潜在变量,从而捕捉集合元素间从粗到细的依赖关系,同时保证排列不变性。我们在点云生成任务上对模型进行了评估,结果表明,在显著更小的模型容量下,其性能可与现有先进方法相媲美。定性实验进一步证明,我们的模型能够泛化至未见过的集合规模,并在无监督条件下学习到有意义的子集关系。代码实现已公开于:https://github.com/jw9730/setvae。