
摘要
本文研究了一种深度卷积神经网络的结构,旨在仅以单张RGB图像为输入,预测前景的alpha蒙版。所提出的网络为全卷积结构,包含两个解码分支,分别用于前景和背景的分类。随后,通过一个融合分支将两个分类结果进行整合,生成具有软分割特性的alpha值。该设计为网络在训练过程中获得更优的alpha值提供了更高的自由度。与仅使用单一解码分支的方法相比,该架构能够隐式地生成trimap,无需用户交互,因而对缺乏数字抠像专业知识的初学者而言具有良好的易用性。实验结果表明,该网络能够为各类物体生成高质量的alpha蒙版,并在人像抠像任务中优于当前最先进的基于CNN的图像抠像方法。