Transformers de vision auto-supervisés pour la détection de logiciels malveillants

La détection des logiciels malveillants joue un rôle fondamental dans la cybersécurité, en raison de la croissance exponentielle des logiciels malveillants et des progrès des attaques informatiques. Les logiciels malveillants nouveaux, non identifiés par les fournisseurs de sécurité, sont fréquemment utilisés dans ces attaques, rendant indispensable le développement d’une solution capable d’apprendre automatiquement à partir de données non étiquetées. Ce papier présente SHERLOCK, un modèle d’apprentissage profond basé sur une approche d’autosurveillance, conçu pour détecter les logiciels malveillants à l’aide de l’architecture Vision Transformer (ViT). SHERLOCK est une méthode innovante de détection des logiciels malveillants qui apprend des caractéristiques uniques permettant de distinguer les programmes malveillants des programmes légitimes grâce à une représentation binaire sous forme d’image. Les résultats expérimentaux, obtenus sur un ensemble de 1,2 million d’applications Android réparties en 47 catégories et 696 familles, montrent qu’un apprentissage auto-supervisé peut atteindre une précision de 97 % pour la classification binaire des logiciels malveillants, surpassant ainsi les techniques les plus avancées existantes. De plus, notre modèle se distingue également des méthodes de pointe dans la classification multi-classes des types et familles de logiciels malveillants, avec des scores macro-F1 respectifs de 0,497 et 0,491.