HyperAIHyperAI
vor 13 Tagen

Können wir Shellcodes über natürliche Sprache generieren? Eine empirische Studie

Pietro Liguori, Erfan Al-Hossami, Domenico Cotroneo, Roberto Natella, Bojan Cukic, Samira Shaikh
Können wir Shellcodes über natürliche Sprache generieren? Eine empirische Studie
Abstract

Das Schreiben von Software-Exploits ist eine wichtige Praxis für offensive Sicherheitsanalysten, um Angriffe zu untersuchen und zu verhindern. Insbesondere sind Shellcodes besonders zeitaufwendig und technisch anspruchsvoll, da sie in Assemblersprache verfasst werden. In dieser Arbeit behandeln wir die Aufgabe der automatischen Generierung von Shellcodes, die ausschließlich auf natürlichsprachlichen Beschreibungen basiert, indem wir einen Ansatz auf der Grundlage von Neural Machine Translation (NMT) vorschlagen. Anschließend präsentieren wir eine empirische Studie mithilfe eines neuartigen Datensatzes (Shellcode_IA32), der aus 3.200 echten Assembler-Codeschnipseln von Linux/x86-Shellcodes aus öffentlichen Datenbanken besteht und mit natürlichsprachlichen Annotationen versehen ist. Zudem schlagen wir neue Metriken zur Bewertung der Genauigkeit von NMT bei der Generierung von Shellcodes vor. Die empirische Analyse zeigt, dass NMT Assembler-Codeschnipsel aus natürlichsprachlichen Beschreibungen mit hoher Genauigkeit generieren kann und in vielen Fällen ganze Shellcodes fehlerfrei erzeugen kann.

Können wir Shellcodes über natürliche Sprache generieren? Eine empirische Studie | Neueste Forschungsarbeiten | HyperAI