图片来源:Jaap Arriens/NurPhoto via Getty
在人工智能(AI)生成文本与真人创作的界限越来越模糊的今天,许多研究机构都在寻求甄别的方法。在10月23日发表于《自然》的一项研究中,美国谷歌旗下公司DeepMind的研究人员设计了一种“水印”,可以巧妙地标记AI生成的文本,并将其部署给聊天机器人的数百万用户。
这并不是第一个为AI生成文本制作的水印,但也许是第一次在现实世界中大规模部署的文本水印。“在我看来,目前最重要的消息是他们真的在这样做。”美国得克萨斯大学奥斯汀分校计算机科学家Scott Aaronson说。
事实上,DeepMind此前已经开发出图像水印技术——SynthID,可以识别AI生成的图像。但在AI生成的文本中,由于单词是唯一可以更改的变量,因此将水印应用于文本比图片更加困难。此外,瑞士联邦理工学院的研究人员发现,任何水印都很容易移除,比如被“擦洗”掉,甚至还能够用于欺诈,即将水印应用于文本,给人一种AI生成的假象。
为了解决这些问题,DeepMind此次开发的文本水印技术——SynthID-Text,引入了Tournament采样算法,将水印整合到大语言模型(LLM)文本的生成步骤中,以一种隐秘但公式化的方式标记模型选择的单词,而这是可以用密钥检测到的。因此,与其他方法相比,这种水印更容易被检测到,而且不会减慢文本的生成速度、降低其生成质量。
此外,由于密钥很复杂,试图删除、擦洗水印或用水印欺诈将变得更加困难。此外,即便使用了第二种LLM解释文本,DeepMind的这种水印仍然可以被检测到。
目前,该水印已开放,开发人员可以将其应用于他们的模型。DeepMind计算机科学家Pushmeet Kohli说:“我们希望其他AI模型开发人员能够接受这一点,并将水印与自己的系统进行集成。”
美国马里兰大学帕克分校计算机科学家黄福荣(音)说:“我很高兴看到谷歌在科技界迈出了这一步。”(徐锐)
相关论文信息:
https://doi.org/10.1038/s41586-024-08025-4
《中国科学报》 (2024-10-25 第2版 国际)