13日前
自然言語を用いたシェルコード生成は可能か? 実証的研究
Pietro Liguori, Erfan Al-Hossami, Domenico Cotroneo, Roberto Natella, Bojan Cukic, Samira Shaikh

要約
ソフトウェアエクスプロイトの作成は、オフェンシブセキュリティアナリストが攻撃を調査し、予防する上で重要な実践である。特にシェルコードはアセンブリ言語で記述されるため、作成に時間がかかり、技術的にも高い課題を伴う。本研究では、自然言語による記述から完全に始めてシェルコードを自動生成するタスクに取り組み、ニューラル機械翻訳(NMT)に基づくアプローチを提案する。さらに、公開データベースから抽出した実際のLinux/x86シェルコード3,200件のアセンブリコードスニペットから構成される新規データセット「Shellcode_IA32」を用いた実証的研究を提示する。このデータセットは自然言語による注釈が付与されている。また、NMTによるシェルコード生成の正確性を評価するための新しい指標を提案する。実証分析の結果、NMTは自然言語から高精度でアセンブリコードスニペットを生成できること、また多くのケースにおいて誤りのない完全なシェルコードを生成できることを示した。