Command Palette
Search for a command to run...

摘要
近年来,大型语言模型(LLMs)的快速发展使得自动化科学发现成为通往人工超级智能的前沿阵地。然而,现有系统要么局限于特定范围的任务,要么受限于LLMs本身有限的创造性能力。为此,我们提出了Spacer——一种无需外部干预即可生成具有创造性和事实依据科学概念的发现系统。Spacer通过“刻意去情境化”(deliberate decontextualization)的方法实现这一目标:将信息拆解为原子级单元——关键词,并从这些关键词之间尚未探索的关联中激发创造力。Spacer系统由两部分构成:(i)Nuri,一个灵感引擎,用于构建关键词集合;(ii)实现管道(Manifesting Pipeline),用于将这些关键词集合精炼为复杂的科学命题。Nuri从基于18万篇生物领域学术论文构建的关键词图谱中,提取出新颖且高潜力的关键词组合。实现管道则在关键词之间发现关联,分析其逻辑结构,验证其合理性,并最终生成原创性的科学概念。根据我们的实验结果,Nuri的评估指标能够以0.737的AUROC得分准确区分高影响力论文。此外,我们的实现管道仅凭关键词集合,便成功重构了最新顶级期刊文章中的核心概念,基于基于LLM的评分系统评估,该重构在超过85%的案例中具有合理性。最后,嵌入空间分析表明,Spacer的输出与前沿研究成果在语义上显著更相似,优于当前最先进的LLMs生成的结果。