2 个月前
量化密集连接U-Net用于高效地标记定位
Zhiqiang Tang; Xi Peng; Shijie Geng; Lingfei Wu; Shaoting Zhang; Dimitris Metaxas

摘要
本文中,我们提出了一种用于高效视觉地标定位的量化密集连接U-Net。该方法的核心思想是在堆叠的U-Net之间全局重用具有相同语义意义的特征。这种密集连接显著改善了信息流,从而提高了定位精度。然而,传统的密集设计在训练和测试过程中都会遇到严重的效率问题。为了解决这一问题,我们首先提出了K阶密集连接(order-K dense connectivity),以去除长距离捷径;然后,我们采用了一种内存高效的实现方法,大幅提升了训练效率,并研究了一种迭代精炼技术,可能将模型大小减半。最后,为了减少训练和测试过程中的内存消耗和高精度运算,我们将定位网络的权重、输入和梯度量化为低比特宽度数值。我们在两个任务中验证了我们的方法:人体姿态估计和面部对齐。实验结果表明,我们的方法在参数量减少约70%、模型大小减少约98%以及节省约75%训练内存的情况下,仍能达到当前最先进的定位精度。代码已发布在 https://github.com/zhiqiangdon/CU-Net。