HyperAIHyperAI
il y a 3 jours

CryptoScope : Utilisation de modèles linguistiques à grande échelle pour la détection automatisée des vulnérabilités logiques en cryptographie

Zhihao Li, Zimo Ji, Tao Zheng, Hao Ren, Xiao Lan
CryptoScope : Utilisation de modèles linguistiques à grande échelle pour la détection automatisée des vulnérabilités logiques en cryptographie
Résumé

Les algorithmes cryptographiques constituent la base de la sécurité moderne, mais leurs implémentations contiennent fréquemment des failles logiques subtiles, difficiles à détecter. Nous introduisons CryptoScope, un nouveau cadre automatisé pour la détection de vulnérabilités cryptographiques, alimenté par des grands modèles linguistiques (LLM). CryptoScope combine la technique de pilotage par chaîne de raisonnement (Chain-of-Thought, CoT) avec la génération augmentée par récupération (Retrieval-Augmented Generation, RAG), guidée par une base de connaissances cryptographiques soigneusement constituée, comprenant plus de 12 000 entrées. Nous évaluons CryptoScope sur LLM-CLVA, un benchmark regroupant 92 cas principalement extraits de vulnérabilités réelles répertoriées dans les CVE, complétés par des défis cryptographiques provenant de grandes compétitions Capture The Flag (CTF) et des exemples synthétiques couvrant 11 langages de programmation. CryptoScope améliore de manière constante les performances par rapport à des modèles LLM de référence performants, augmentant les résultats de DeepSeek-V3 de 11,62 %, de GPT-4o-mini de 20,28 % et de GLM-4-Flash de 28,69 %. En outre, il permet de détecter 9 failles auparavant inconnues dans des projets cryptographiques open source largement utilisés.

CryptoScope : Utilisation de modèles linguistiques à grande échelle pour la détection automatisée des vulnérabilités logiques en cryptographie | Articles de recherche récents | HyperAI