
摘要
我们提出 ClothFlow,一种基于外观光流(appearance-flow)的生成模型,用于实现姿态引导的人像图像生成与虚拟试穿任务。通过估计源衣物区域与目标衣物区域之间的密集光流,ClothFlow 能够有效建模几何形变,并自然地将外观信息迁移,从而合成新颖的图像,如图1所示。该方法采用三阶段框架实现:1)在给定目标姿态的条件下,首先估计人体语义布局,为生成过程提供更丰富的引导信息;2)基于两个特征金字塔网络,构建级联光流估计网络,精确计算对应衣物区域间的外观匹配关系。由此得到的密集光流可对源图像进行灵活变形,以适应衣物的形变;3)最后,生成网络以变形后的衣物区域作为输入,渲染出目标视角下的图像。我们在 DeepFashion 数据集上进行了姿态引导人像生成的大量实验,并在 VITON 数据集上完成了虚拟试穿任务的评估。实验结果在定性和定量两方面均验证了本方法的有效性。