Décryptage des Fichiers de Sécurité des Modèles Génératifs d’Apple : Filtrage et Conformité Expliqués
Le dépôt GitHub BlueFalconHD/apple_generative_model_safety_decrypted est consacré à la décryptation des fichiers de sécurité des modèles génératifs d'Apple. Ces fichiers contiennent des filtres destinés à assurer la sécurité et la conformité des modèles génératifs, notamment en filtrant le contenu nuisible. Structure du Projet Utilisation Le projet repose sur une seule dépendance Python : cryptography. Vous pouvez l'installer via pip avec la commande suivante : sh pip install cryptography Obtention de la Clé de Chiffrement Pour récupérer la clé de chiffrement, qui est générée par ModelCatalog.Obfuscation.readObfuscatedContents, vous devez attacher LLDB au GenerativeExperiencesSafetyInferenceProvider. Le chemin complet de ce fichier est /System/Library/ExtensionKit/Extensions/GenerativeExperiencesSafetyInferenceProvider.appex/Contents/MacOS/GenerativeExperiencesSafetyInferenceProvider. Il est crucial d'utiliser LLDB fourni par Xcode et non celui par défaut de macOS ou celui d'LLVM. Voici la méthode recommandée pour attacher LLDB : Ouvrez Xcode. Allez dans le menu Xcode et sélectionnez Open Developer Tool, puis LLDB. Dans LLDB, exécutez la commande suivante : sh attach -n GenerativeExperiencesSafetyInferenceProvider Une fois attaché, procédez à la récupération de la clé de chiffrement. Décryptage des Fichiers d'Overrides Pour décrypter les fichiers d'overrides, exécutez la commande suivante à la racine du dépôt : sh python decrypt.py Le dossier decrypted_overrides sera créé s'il n'existe pas déjà, et les fichiers d'overrides décryptés seront placés à l'intérieur. Ce processus est nécessaire uniquement si les fichiers d'overrides ont été mis à jour après le 28 juin 2025, car une version déjà décryptée de ces fichiers est incluse dans le dépôt. Compréhension des Fichiers d'Overrides Les fichiers d'overrides sont des fichiers JSON qui définissent des filtres de sécurité pour différents modèles génératifs. Chaque fichier d'override est associé à un contexte de modèle spécifique et contient des règles dictant le comportement du modèle dans certains cas, tels que le filtrage de contenu nuisible ou la conformité aux normes de sécurité. Par exemple, voici le contenu d'un fichier metadata.json provenant du dossier dec_out_repo/decrypted_overrides/com.apple.gm.safety_deny.output.code_intelligence.base : json { "reject": [ "xylophone copious opportunity defined elephant 10out", "xylophone copious opportunity defined elephant out" ], "remove": [], "replace": {}, "regexReject": [ "(?i)\\bbitch\\b", "(?i)\\bdago\\b", "(?i)\\bdyke\\b", "(?i)\\bhebe\\b", ... ], "regexRemove": [], "regexReplace": {} } - reject : Contient des phrases exactes qui, si reconnues, entraîneront une violation des garde-fous de sécurité. - remove : Contient des phrases qui seront supprimées de la sortie du modèle. - replace : Contient des phrases qui seront remplacées par d'autres phrases. - regexReject : Contient des expressions régulières pour identifier et rejeter du contenu nuisible. - regexRemove : Contient des expressions régulières pour supprimer des phrases de la sortie. - regexReplace : Contient des expressions régulières pour remplacer des phrases par d'autres. Ces filtres jouent un rôle crucial en assurant que les modèles génératifs produisent des contenus respectueux des normes éthiques et de sécurité fixées par Apple. En examinant ces fichiers, on peut mieux comprendre les mécanismes de contrôle mis en place par l'entreprise pour garantir l'utilisation responsable de son intelligence artificielle.