HyperAIHyperAI
vor 3 Tagen

CryptoScope: Die Nutzung großer Sprachmodelle zur automatisierten Erkennung kryptographischer Logikschwächen

Zhihao Li, Zimo Ji, Tao Zheng, Hao Ren, Xiao Lan
CryptoScope: Die Nutzung großer Sprachmodelle zur automatisierten Erkennung kryptographischer Logikschwächen
Abstract

Kryptografische Algorithmen sind grundlegend für moderne Sicherheitssysteme, doch ihre Implementierungen enthalten häufig subtile logische Fehler, die schwer zu erkennen sind. Wir stellen CryptoScope vor, einen neuartigen Rahmen für die automatisierte Erkennung kryptografischer Schwachstellen, der auf Großsprachmodellen (Large Language Models, LLMs) basiert. CryptoScope kombiniert die Chain-of-Thought-(CoT)-Prompting-Technik mit Retrieval-Augmented Generation (RAG), wobei eine sorgfältig zusammengestellte kryptografische Wissensbasis mit über 12.000 Einträgen als Leitfaden dient. Wir evaluieren CryptoScope anhand des Benchmarks LLM-CLVA, der aus 92 Fällen besteht, die hauptsächlich aus realen CVE-Schwachstellen stammen und durch kryptografische Herausforderungen aus bedeutenden Capture-The-Flag-(CTF)-Wettbewerben sowie synthetische Beispiele in 11 Programmiersprachen ergänzt werden. CryptoScope erzielt konsistent bessere Ergebnisse als starke LLM-Baselines: Die Leistung von DeepSeek-V3 steigt um 11,62 %, die von GPT-4o-mini um 20,28 % und die von GLM-4-Flash um 28,69 %. Zudem gelang es, 9 bisher nicht bekannte Schwachstellen in weit verbreiteten Open-Source-Kryptografieprojekten zu identifizieren.

CryptoScope: Die Nutzung großer Sprachmodelle zur automatisierten Erkennung kryptographischer Logikschwächen | Neueste Forschungsarbeiten | HyperAI