8 个月前

自然语言处理

Zi Liang; Pinghui Wang; Ruofei Zhang; Nuo Xu; Lifeng Xing; Shuo Zhang

摘要

语言模型参数的急剧增加导致了一种新的趋势，即将模型部署在云服务器上，这引发了对基于Transformer模型的私有推理日益增长的担忧。现有的两方隐私保护技术仅考虑了自然语言理解（NLU）场景，而自然语言生成（NLG）中的私有推理问题，对于翻译和代码补全等应用至关重要，却尚未得到充分研究。此外，以往的隐私保护技术在模型训练过程中存在收敛问题，并且由于忽视了自回归生成中耗时的操作，在应用于NLG模型时表现出较差的推理速度。为了解决这些问题，我们提出了一种针对基于Transformer的语言模型的快速私有文本生成框架——MERGE。MERGE通过重用输出隐藏状态作为词嵌入来绕过嵌入计算，并重新组织Transformer模块中的线性操作以加速前向过程。大量实验表明，在序列长度为512的情况下，MERGE比未加密的基本模型实现了26.5倍的速度提升，并减少了80%的通信成本，相比最先进的近似模型最高可实现10倍的速度提升。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

8 个月前

自然语言处理

Zi Liang; Pinghui Wang; Ruofei Zhang; Nuo Xu; Lifeng Xing; Shuo Zhang

摘要

语言模型参数的急剧增加导致了一种新的趋势，即将模型部署在云服务器上，这引发了对基于Transformer模型的私有推理日益增长的担忧。现有的两方隐私保护技术仅考虑了自然语言理解（NLU）场景，而自然语言生成（NLG）中的私有推理问题，对于翻译和代码补全等应用至关重要，却尚未得到充分研究。此外，以往的隐私保护技术在模型训练过程中存在收敛问题，并且由于忽视了自回归生成中耗时的操作，在应用于NLG模型时表现出较差的推理速度。为了解决这些问题，我们提出了一种针对基于Transformer的语言模型的快速私有文本生成框架——MERGE。MERGE通过重用输出隐藏状态作为词嵌入来绕过嵌入计算，并重新组织Transformer模块中的线性操作以加速前向过程。大量实验表明，在序列长度为512的情况下，MERGE比未加密的基本模型实现了26.5倍的速度提升，并减少了80%的通信成本，相比最先进的近似模型最高可实现10倍的速度提升。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供