2 个月前
寻找高效的多尺度架构以实现密集图像预测
Liang-Chieh Chen; Maxwell D. Collins; Yukun Zhu; George Papandreou; Barret Zoph; Florian Schroff; Hartwig Adam; Jonathon Shlens

摘要
神经网络架构的设计是实现机器学习系统在广泛任务中达到最先进性能的重要组成部分。许多研究致力于通过巧妙构建搜索空间并结合简单的学习算法来自动设计和构建架构。最近的研究进展表明,这样的元学习方法在图像分类任务上可能超过可扩展的人类发明的架构。一个开放的问题是这些方法能在多大程度上推广到新领域。在这项工作中,我们探索了针对场景解析、人体部位分割和语义图像分割等密集图像预测任务的元学习技术的构建。在这个领域中构建可行的搜索空间具有挑战性,因为视觉信息的多尺度表示以及对高分辨率图像进行操作的需求。基于对密集图像预测技术的综述,我们构建了一个递归搜索空间,并证明即使采用高效的随机搜索,也能识别出优于人类发明的架构,并在三个密集预测任务上实现了最先进性能,包括Cityscapes(街道场景解析)上的82.7%,PASCAL-Person-Part(人体部位分割)上的71.3%,以及PASCAL VOC 2012(语义图像分割)上的87.9%。此外,所得到的架构更加计算高效,所需的参数量和计算成本仅为之前最先进系统的二分之一。