谷歌开源AI文本水印工具SynthID 一眼识别出AI生成内容

最近，谷歌宣布将其文本水印工具 SynthID 开源，旨在帮助开发者更好地识别 AI 生成的文本。这一工具现已通过谷歌的 “负责任生成 AI 工具包” 向公众开放使用。

谷歌 DeepMind 的研究副总裁 Pushmeet Kohli 表示，这项技术将使其他生成式 AI 开发者能够检测文本输出是否来自他们自己的大型语言模型（LLM），这将有助于他们以更负责任的方式构建 AI 应用。

在当今这个信息传播迅速的时代，水印技术显得尤为重要。随着大型语言模型被用来传播政治虚假信息、生成不当内容等，水印工具的需求也在不断上升。比如，加利福尼亚州正考虑将 AI 水印作为强制性要求，而中国早在去年就已开始要求使用水印。尽管如此，相关技术仍在不断完善之中。

谷歌的 SynthID 技术首次在去年8月被公布。它通过在生成的文本、图像、音频和视频中添加不可见的水印，使得 AI 生成的输出更易于识别。

具体来说，SynthID 会在文本输出中微调每个生成词的概率，使得这些修改在软件中可被识别但不被人类察觉。例如，当模型生成 “我最喜欢的热带水果是__。” 时，可能会选择 “芒果”、“荔枝”、“木瓜” 或 “榴莲” 等词。每个词都有一个概率分数，SynthID 会在不影响文本质量、准确性和创造性的前提下，调整这些分数。

这种调整会在整个生成的文本中持续进行，所以一段文本可能会有十个以上的调整分数，而整页内容可能会包含数百个。最终，这些调整后的概率分数模式将构成水印。谷歌表示，该系统已集成到其 Gemini 聊天机器人中，且不会影响生成文本的质量和速度。然而，它在短文本、已重写或翻译的内容以及针对事实问题的回应上仍面临一些挑战。

谷歌在一篇博客中指出:“SynthID 并不是识别 AI 生成内容的万能钥匙，但它是开发更可靠 AI 识别工具的重要基石，可以帮助数百万用户做出更明智的决策。”

项目入口:https://ai.google.dev/responsible/docs/safeguards/synthid?hl=zh-cn