HyperAIHyperAI

Command Palette

Search for a command to run...

面向边缘云计算的上下文感知深度模型压缩

Baochun Li Xinbing Wang Dixi Yao Xing Zhao Jiaju Chen Jiayu Xu Liyao Xiang Lingdong Wang

摘要

尽管深度神经网络(DNN)引发了范式变革,但其高昂的计算需求始终是其在边缘设备(如可穿戴设备和智能手机)上部署的主要障碍。为此,已有研究提出一种混合边缘-云计算框架,通过在假设网络条件恒定的前提下对DNN操作进行简单划分,将部分计算任务迁移至云端。然而,现实场景中的网络状态因上下文而异,且DNN划分策略的可选空间有限。本文旨在利用DNN的结构灵活性,使其能够适应不同的网络环境与部署平台。具体而言,我们设计了一种基于强化学习的决策引擎,以在模型精度与计算延迟的联合优化目标下,自动搜索最优的模型转换策略。该引擎生成一个上下文感知的模型树结构,使DNN能够在运行时动态选择合适的模型分支进行切换。通过仿真与实地实验验证,所提出方法在保持模型精度的同时,实现了30%至50%的延迟降低。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供