HyperAIHyperAI

Command Palette

Search for a command to run...

MnasNet:面向平台的移动设备神经架构搜索

Mingxing Tan Bo Chen Ruoming Pang Vijay Vasudevan Mark Sandler Andrew Howard Quoc V. Le

Abstract

为移动设备设计卷积神经网络(CNN)是一项挑战,因为移动模型需要既小巧又快速,同时还要保持高精度。尽管在设计和改进移动CNN的所有方面已经投入了大量努力,但在考虑众多架构可能性时,手动平衡这些权衡仍然非常困难。在本文中,我们提出了一种自动化的移动神经架构搜索(MNAS)方法,该方法明确地将模型延迟纳入主要目标,以便搜索能够找到在精度和延迟之间具有良好平衡的模型。与以往通过另一个通常不准确的代理指标(例如FLOPS)来考虑延迟的方法不同,我们的方法直接通过在手机上执行模型来测量实际的推理延迟。为了进一步在灵活性和搜索空间大小之间取得恰当的平衡,我们提出了一种新的分层因子化搜索空间,鼓励网络各层之间的多样性。实验结果表明,我们的方法在多个视觉任务中始终优于最先进的移动CNN模型。在ImageNet分类任务中,我们的MnasNet实现了75.2%的Top-1精度,在Pixel手机上的延迟为78毫秒,比MobileNetV2 [29]快1.8倍且精度高出0.5%,比NASNet [36]快2.3倍且精度高出1.2%。我们的MnasNet还在COCO目标检测任务中实现了比MobileNets更高的mAP质量。代码位于https://github.com/tensorflow/tpu/tree/master/models/official/mnasnet


Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供