11日前
ディープ畳み込みフォレスト:テキストにおけるスパム検出のための動的ディープアンサンブルアプローチ
Mai A. Shaaban, Yasser F. Hassan, Shawkat K. Guirguis

要約
モバイルメッセージサービスの利用が拡大する中、スパムメッセージがフィッシング攻撃の主要な拡散経路となっていることから、クレジットカードやパスワードといった機密情報を盗む目的の社会工学的攻撃が広がっている。さらに、新型コロナウイルス感染症(COVID-19)に関する誤った情報や噂がSNS上で広く拡散され、人々の不安や混乱を招いている。こうした状況を踏まえ、スパムコンテンツのフィルタリングはリスクと脅威を低減する上で極めて重要である。従来の研究では、スパム分類に機械学習や深層学習(deep learning)の手法が用いられてきたが、これらのアプローチには2つの課題がある。機械学習モデルは手動による特徴量エンジニアリングを必要とする一方、深層ニューラルネットワークは高い計算コストを要する。本論文では、モデルの複雑さを動的に調整し、特徴抽出を自動的に行う動的ディープアンサンブルモデルを提案する。本モデルは、畳み込み層およびプーリング層を用いて特徴を自動抽出し、ランダムフォレストや極端にランダム化された木(extremely randomized trees)といったベース分類器を活用して、テキストをスパムまたは正当なメッセージに分類する。さらに、ブースティングやバギングといったアンサンブル学習的手法を組み合わせている。その結果、本モデルは精度(precision)、再現率(recall)、F1スコア、正解率(accuracy)ともに98.38%という高い性能を達成した。