HyperAI超神经

SynthID-Text AI 文本生成水印工具

一、教程简介

SynthID 是 Google DeepMind 于 2024 年推出的一项技术,可通过将数字水印直接嵌入到 AI 生成的图片、音频、文本或视频中来为 AI 生成的内容添加水印并对其进行识别。如需更完整地了解该方法的技术说明,请参阅 Nature 中的论文「Scalable watermarking for identifying large language model outputs」。

该教程为 SynthID-Text,一种用于识别和验证由大型语言模型 (LLM) 生成的文本的水印技术,它可以保持文本质量并实现高检测精度,同时将延迟成本降至最低。这项技术的核心在于在不损害文本质量和用户体验的前提下,通过细微调整生成过程中的 Token 概率分数来嵌入几乎无法察觉的水印,从而实现高检测精度。 SynthID-Text 不会影响 LLM 训练,只修改了采样程序,水印检测在计算上是高效的,无需使用底层 LLM 。

该教程演示模型使用了 Gemma-2b-it,使用的水印检测器为 Mean(能够快速演示并不经过训练)。带水印的回复往往比无水印的回复有更高的平均分数,检测结果对应 2 个得分:

  • 平均分数:要对响应进行分类,您可以设置分数阈值,但这将取决于您的用例的分数分布和您期望的误报/漏报率。
  • 加权平均分数:加权平均评分函数比平均评分函数提供更好的分类性能(特别是,带水印的响应得分更高)。

二、运行步骤

启动容器后点击 API 地址即可进入 Web 界面

输入提示词

在对话框内输入提示词,点击提交,模型分别会产生两种回复,一种为不带水印的,一种为带水印的。随后使用水印检测工具生成评估分数。

图 1 水印文本生成与检测

通过对比以上 2 个分数,得分越高越有可能添加了水印,用于生产后可设置一个水印阈值确定是否输出的文本是否添加水印。

交流探讨

🖌️ 如果大家看到优质项目,欢迎后台留言推荐!另外,我们还建立了教程交流群,欢迎小伙伴们扫码备注【SD 教程】入群探讨各类技术问题、分享应用效果↓