
摘要
对于利用深度神经网络(DNNs)的实时应用而言,模型在目标任务上实现高精度和在目标计算平台上实现低延迟推理至关重要。尽管神经架构搜索(NAS)已被有效用于开发图像分类的低延迟网络,但对于其他视觉任务,使用NAS优化DNN架构的研究相对较少。在这项工作中,我们提出了首个针对密集语义分割的无代理硬件感知搜索方法。通过这种方法,我们在Cityscapes语义分割数据集上推进了低延迟网络的最先进精度。我们的小规模SqueezeNAS网络在NVIDIA AGX Xavier上的推理时间低于35毫秒,验证集类别mIOU达到68.02%。我们的大规模SqueezeNAS网络在推理时间低于100毫秒的情况下,类别mIOU达到73.62%。我们证明了通过利用NAS找到既针对特定任务又针对推理硬件优化的网络可以显著提高性能。此外,我们还详细分析了我们的网络与最近的最先进架构之间的差异。