2 天前

CryptoScope:利用大语言模型实现密码逻辑漏洞的自动化检测

Zhihao Li, Zimo Ji, Tao Zheng, Hao Ren, Xiao Lan
CryptoScope:利用大语言模型实现密码逻辑漏洞的自动化检测
摘要

密码学算法是现代安全体系的基石,但其实际实现中常常隐藏着难以察觉的细微逻辑缺陷。我们提出 CryptoScope——一种基于大型语言模型(LLM)的自动化密码学漏洞检测新框架。CryptoScope 将思维链(Chain-of-Thought, CoT)提示技术与检索增强生成(Retrieval-Augmented Generation, RAG)相结合,并依托一个经过精心整理的密码学知识库,该知识库包含超过 12,000 条条目。我们在 LLM-CLVA 基准上对 CryptoScope 进行评估,该基准包含 92 个案例,主要源自真实世界中的 CVE 漏洞,同时补充了来自大型夺旗(Capture The Flag, CTF)竞赛的密码学挑战题以及覆盖 11 种编程语言的合成样例。实验结果表明,CryptoScope 在多个强基准 LLM 上均表现出显著提升:相较于 DeepSeek-V3 提升 11.62%,GPT-4o-mini 提升 20.28%,GLM-4-Flash 提升 28.69%。此外,该框架还成功发现了多个广泛使用的开源密码学项目中此前未公开的 9 个漏洞。