HyperAI超神经

OpenAI 于今日正式发布开源的"Privacy Filter"，这是一款专为检测和隐去文本中个人身份信息（PII）而设计的轻量级模型。作为 OpenAI 构建安全软件生态的重要举措，该工具旨在帮助开发者在训练、索引及日志等流程中轻松实施严格的隐私保护。 Privacy Filter 具备前沿的隐私检测能力，能够基于上下文理解对非结构化文本进行精准识别。与传统仅依赖固定规则匹配邮箱或电话号的工具不同，该模型能更灵活地处理复杂语境，有效区分公开信息与需隐私保护的敏感数据。其最大优势在于支持本地运行，数据无需上传至服务器即可完成脱敏，显著降低了泄露风险。模型采用双向标记分类架构，总参数量仅为 15 亿，可在单遍处理中高效完成长文本检测。在核心性能方面，Privacy Filter 在 PII-Masking-300k 基准测试中表现优异，经修正后的 F1 分数高达 97.43%。它能精准覆盖账户号码、密码、API 密钥等八类敏感信息，并通过 BIOES 标签规范输出边界。OpenAI 表示，该模型还可根据具体需求进行微调，以适应特定领域的隐私策略。需注意，Privacy Filter 并非万能合规工具，仍存在误判可能，在医疗、金融等高风险场景中仍需人工复核。该模型已基于 Apache 2.0 协议在 Hugging Face 和 GitHub 开源，面向实验、定制及商业部署。OpenAI 希望通过发布此类高效、可审查的基础设施，推动行业建立“隐私设计”标准，让 AI 学习世界而非个人隐私。

相关链接

相关链接

相关链接

字节开源 Lance，3B 模型包揽理解/生成/编辑；新加坡国立大学提出 ViMU 数据集：涵盖 588 个视频与无提示问答

字节开源 Lance，3B 模型包揽理解/生成/编辑；新加坡国立大学提出 ViMU 数据集：涵盖 588 个视频与无提示问答

Command Palette

OpenAI 推出隐私过滤器

相关链接

Command Palette

OpenAI 推出隐私过滤器

相关链接

Command Palette

OpenAI 推出隐私过滤器

相关链接

字节开源 Lance，3B 模型包揽理解/生成/编辑；新加坡国立大学提出 ViMU 数据集：涵盖 588 个视频与无提示问答

字节开源 Lance，3B 模型包揽理解/生成/编辑；新加坡国立大学提出 ViMU 数据集：涵盖 588 个视频与无提示问答