Apple의 AI 안전 필터 모델 해독 파일 공개
GitHub - BlueFalconHD/apple_generative_model_safety_decrypted: 애플 인텔리전스를 위한 해독된 생성 모델 안전 파일이 포함되어 있습니다. 구조 사용 방법 Python 의존성: 해독 스크립트를 실행하기 위해 필요한 유일한 의존성은 cryptography입니다. 이를 설치하려면 다음 명령어를 사용하세요: pip install cryptography 암호화 키 가져오기 암호화 키 검색: overrides의 암호화 키(모델 카탈로그에서 생성)를 가져오려면 LLDB를 GenerativeExperiencesSafetyInferenceProvider에 연결해야 합니다. 이는 /System/Library/ExtensionKit/Extensions/GenerativeExperiencesSafetyInferenceProvider.appex/Contents/MacOS/GenerativeExperiencesSafetyInferenceProvider 경로에 위치해 있습니다. 이 때, Xcode의 LLDB를 사용하는 것이 중요하며, 기본 macOS 또는 LLVM의 LLDB는 사용하지 않아야 합니다. LLDB를 연결하는 권장 방법은 다음과 같습니다: Xcode를 열고, GenerativeExperiencesSafetyInferenceProvider 프로세스를 디버그 모드로 시작합니다. LLDB 콘솔에서 po [ModelCatalog.Obfuscation readObfuscatedContents]를 실행하여 암호화 키를 확인합니다. 암호화된 오버라이드 해독 오버라이드 해독: 오버라이드를 해독하려면 이 저장소의 루트에서 다음 명령어를 실행하세요: python decrypt_overrides.py 이 명령어를 실행하면 decrypted_overrides 디렉토리가 생성되며, 여기에 해독된 오버라이드 파일이 저장됩니다. 2025년 6월 28일 기준으로 이미 최신 버전의 해독된 오버라이드 파일이 저장소에 포함되어 있으므로, 오버라이드가 업데이트되지 않은 한 이 과정은 필요하지 않습니다. 오버라이드 이해 오버라이드 내용: 오버라이드는 JSON 파일 형태로, 다양한 생성 모델에 대한 안전 필터를 포함하고 있습니다. 각 오버라이드는 특정 모델 컨텍스트와 연관되어 있으며, 특정 상황에서 모델의 동작을 결정하는 규칙을 담고 있습니다. 예를 들어, 유해한 내용을 필터링하거나 안전 기준 준수를 보장하는 등의 역할을 합니다. 예시: metadata.json 파일의 일부분은 다음과 같습니다: json { "reject": [ "xylophone copious opportunity defined elephant 10out", "xylophone copious opportunity defined elephant out" ], "remove": [], "replace": {}, "regexReject": [ "(?i)\\bbitch\\b", "(?i)\\bdago\\b", "(?i)\\bdyke\\b", "(?i)\\bhebe\\b", ... ], "regexRemove": [], "regexReplace": {} } reject 필드: 정확한 문구가 포함되면 가드레일 위반으로 처리됩니다. remove 필드: 출력에서 제거될 문구를 포함합니다. replace 필드: 다른 문구로 대체될 문구를 포함합니다. regexReject, regexRemove, regexReplace 필드: 정규 표현식을 사용하여 유사한 방식으로 콘텐츠를 매치하고 필터링합니다. 업계 전문가의 평가 및 회사 프로필 평가: 이 프로젝트는 애플의 생성 모델 안전성을 향상시키는 데 중요한 역할을 하고 있습니다. 생성 모델이 사용자에게 제공하는 콘텐츠를 효과적으로 관리함으로써, 애플은 AI 기술의 안전성을 강화하고 있습니다. 이러한 필터링 시스템은 유해한 정보를 차단하고, 사용자 경험을 긍정적으로 만드는 데 기여합니다. 회사 프로필: BlueFalconHD는 오픈 소스 프로젝트를 통해 기술 커뮤니티에 기여하는 개발자 집단입니다. 이들은 애플의 생성 모델 안전성을 분석하고, 이를 공개하여 다른 연구자들이 참조할 수 있도록 하고 있습니다. 이 프로젝트는 애플의 AI 기술 발전과 안전성 강화에 중요한 역할을 하고 있습니다.