HyperAI超神经

Paper2Code:从机器学习科学论文自动生成代码

Minju Seo, Jinheon Baek, Seongyun Lee, Sung Ju Hwang
发布日期: 4/26/2025
Paper2Code:从机器学习科学论文自动生成代码
摘要

尽管机器学习研究取得了快速进展,但相应的代码实现往往不可用,这使得研究人员在复现结果和基于先前工作进行进一步研究时既缓慢又费力。与此同时,近期的大型语言模型(LLMs)在理解和生成高质量代码方面表现出色。受此启发,我们引入了PaperCoder,这是一种多代理大型语言模型框架,能够将机器学习论文转化为功能性的代码仓库。PaperCoder的操作分为三个阶段:规划阶段,该阶段构建高层次的路线图,设计系统架构并绘制图表,识别文件依赖关系,并生成配置文件;分析阶段,专注于解释特定实现的细节;生成阶段,在此阶段产生模块化且考虑依赖关系的代码。此外,每个阶段都通过一组专门设计的代理来实例化,这些代理能够在整个流程中有效协作。我们对PaperCoder进行了评估,基于模型和人类评价(特别是来自原始论文作者的评价),如果可用的话,则以作者发布的代码仓库作为基准真相。我们的结果显示,PaperCoder在创建高质量、忠实于原作的实现方面具有显著效果。此外,在最近发布的PaperBench基准测试中,它始终表现出色,大幅超越了强大的基线模型。