在 Discord 上讨论

10 个月前

Baochun Li Xinbing Wang Dixi Yao Xing Zhao Jiaju Chen Jiayu Xu Liyao Xiang Lingdong Wang

摘要

尽管深度神经网络（DNN）引发了范式变革，但其高昂的计算需求始终是其在边缘设备（如可穿戴设备和智能手机）上部署的主要障碍。为此，已有研究提出一种混合边缘-云计算框架，通过在假设网络条件恒定的前提下对DNN操作进行简单划分，将部分计算任务迁移至云端。然而，现实场景中的网络状态因上下文而异，且DNN划分策略的可选空间有限。本文旨在利用DNN的结构灵活性，使其能够适应不同的网络环境与部署平台。具体而言，我们设计了一种基于强化学习的决策引擎，以在模型精度与计算延迟的联合优化目标下，自动搜索最优的模型转换策略。该引擎生成一个上下文感知的模型树结构，使DNN能够在运行时动态选择合适的模型分支进行切换。通过仿真与实地实验验证，所提出方法在保持模型精度的同时，实现了30%至50%的延迟降低。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

在 Discord 上讨论

10 个月前

Baochun Li Xinbing Wang Dixi Yao Xing Zhao Jiaju Chen Jiayu Xu Liyao Xiang Lingdong Wang

摘要

尽管深度神经网络（DNN）引发了范式变革，但其高昂的计算需求始终是其在边缘设备（如可穿戴设备和智能手机）上部署的主要障碍。为此，已有研究提出一种混合边缘-云计算框架，通过在假设网络条件恒定的前提下对DNN操作进行简单划分，将部分计算任务迁移至云端。然而，现实场景中的网络状态因上下文而异，且DNN划分策略的可选空间有限。本文旨在利用DNN的结构灵活性，使其能够适应不同的网络环境与部署平台。具体而言，我们设计了一种基于强化学习的决策引擎，以在模型精度与计算延迟的联合优化目标下，自动搜索最优的模型转换策略。该引擎生成一个上下文感知的模型树结构，使DNN能够在运行时动态选择合适的模型分支进行切换。通过仿真与实地实验验证，所提出方法在保持模型精度的同时，实现了30%至50%的延迟降低。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供