HyperAIHyperAI

Command Palette

Search for a command to run...

CodeTrans:通过自监督深度学习和高性能计算破解硅代码的语言

Ahmed Elnaggar* Wei Ding* Llion Jones Tom Gibbs Tamas Feher Christoph Angerer Silvia Severini Florian Matthes Burkhard Rost

摘要

目前,越来越多的成熟自然语言处理应用使人们的生活更加便捷。这些应用是通过源代码构建的,而源代码是软件工程中的语言。然而,用于理解和处理源代码语言以简化软件工程过程的应用研究相对较少。与此同时, Transformer 模型(Transformer Model),尤其是其与迁移学习(Transfer Learning)的结合,已被证明是自然语言处理任务中的一种强大技术。这些突破为处理源代码和解决软件工程任务指明了有前景的方向。本文介绍了CodeTrans——一种用于软件工程领域的编码器-解码器 Transformer 模型,该模型探索了编码器-解码器 Transformer 模型在六个软件工程任务中的有效性,包括十三个子任务。此外,我们还研究了不同训练策略的效果,包括单任务学习、迁移学习、多任务学习以及多任务学习后的微调。CodeTrans在所有任务上均优于当前最先进的模型。为了加速未来在软件工程领域的研究工作,我们已发布了CodeTrans的预训练模型。https://github.com/agemagician/CodeTrans


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供