
摘要
我们的目标是设计一种架构,该架构在保留卷积神经网络(CNNs)在地标定位任务中的突破性性能的同时,具有轻量级、紧凑的特点,并适用于计算资源有限的应用。为此,我们做出了以下贡献:(a) 我们首次研究了神经网络二值化对定位任务的影响,特别是人体姿态估计和面部对齐。我们对各种设计选择进行了详尽的评估,识别了性能瓶颈,并且更重要的是提出了多种正交的方法来提升性能。(b) 基于我们的分析,我们提出了一种新颖的分层、并行和多尺度残差架构,该架构在参数数量相同的情况下显著提升了标准瓶颈块的性能,从而弥合了原始网络与其二值化版本之间的差距。(c) 我们进行了大量的消融研究,揭示了所提出的块的特性和性能。(d) 我们展示了在最具挑战性的人体姿态估计和面部对齐数据集上的实验结果,在许多情况下报告了最先进的性能。(e) 我们还提供了面部部分分割问题的额外实验结果。代码可从 https://www.adrianbulat.com/binary-cnn-landmark 下载。