HyperAIHyperAI

Command Palette

Search for a command to run...

代码不只是实现工具,更是值得记录与分享的智慧资产

在科学研究中,代码早已不再是辅助工具,而是核心组成部分。从短小的脚本到模拟地球气候、蛋白质结构甚至宇宙演化的复杂系统,科研工作几乎离不开软件。然而,当前学术界对代码的重视仍远远不够,常将其视为研究的“附带产物”,缺乏系统性的记录、共享与价值认可。 软件具有高度动态性,其版本迭代频繁,开源项目常由多人协作维护,却往往没有明确的“最终版本”或正式发布记录。不同版本、文件甚至功能模块的引用方式不一,极易引发混淆。与此同时,代码既需作为研究成果的一部分被长期保存和公开,又需持续更新、维护和改进,这种矛盾让科研人员、机构和资助方陷入两难。 尽管“FAIR原则”(可发现、可访问、可互操作、可重用)被用于数据管理,但将其直接套用于软件面临巨大挑战:每次版本更新都需重新上传、更新元数据、作者列表、依赖关系等,对开发者而言负担过重,尤其在每周甚至每日发布周期的项目中几乎不可行。 为此,我们提出“CODE beyond FAIR”新框架,倡导更务实、可持续的代码管理方式。核心建议包括: 首先,应将代码共享能力纳入科研教育体系。所有博士生,无论学科背景,都应在研究生初期接受基础软件工程培训。目前,斯坦福、哈佛、牛津、剑桥等高校已开设编程与计算思维课程。此外,像Neuromatch Academy和The Carpentries这样的国际组织,已通过在线课程为全球数万名科研人员提供从基础编程到机器学习的系统培训,显著提升了科研人员的代码素养。 其次,应简化代码归档流程。出版机构应在论文投稿阶段即强制要求代码共享与存档,可通过一键上传至GitHub、Zenodo或Software Heritage等平台实现。GitHub已成为全球代码共享的枢纽,应被更广泛地整合进科研流程。 最后,科研机构应推动跨平台互操作,如通过欧洲开放科学云等平台实现项目与版本间的有效链接,提升代码的可追溯性与复用效率。 代码不应是研究的“事后补丁”,而应被视作与数据、论文同等重要的科研产出。唯有通过教育、制度与技术协同推进,才能真正实现科研的透明、可复现与可持续发展。

相关链接