他们用“水印”鉴别AI生成文章—新闻

作者：冯维维来源：中国科学报发布时间：2024/10/25 15:49:33

选择字号：小中大

他们用“水印”鉴别AI生成文章

英国谷歌深度思维公司的科学家开发了一种能为大语言模型生成的文本添加水印的工具，能提高对合成内容的鉴别和追溯能力。相关研究近日发表于《自然》。

大语言模型（LLM）是广泛使用的人工智能（AI）工具，能为聊天机器人、写作支持和其他目的生成文本。不过，人们很难识别并追溯AI生成文本的来源，使信息的可靠性成疑。水印被认为能解决这一问题，但生产系统对质量和计算效率的严格要求阻碍了其规模化应用。

深度思维公司的Sumanth Dathathri、Pushmeet Kohli和同事开发了一个利用一种全新采样算法给AI生成文本添加水印的系统，称为SynthID-Text。该工具利用一个采样算法对LLM的词汇选择进行巧妙偏移，插入一个能被相关检测软件识别的签名。这既可以通过一种“扭曲”路径实现——该路径能提高水印质量但会轻微影响输出质量，或是通过一种能保留文本质量的“非扭曲”路径。

研究者在多个公开模型上评估了这些水印的可检测性，发现SynthID-Text的可检测性优于当前其他方法。他们还用Gemini LLM的近2000万次在线对话回答评估了这些文本的质量，结果显示非扭曲水印形式不会降低文本质量。最后，SynthID-Text的使用对LLM运行所需算力的影响可忽略不计，减少了应用上的障碍。

研究者提醒道，编辑文本或改写输出就能避免出现文本水印。但该研究证明，一个为AI生成内容的生成式文本添加水印的工具是可行的，继而有望提升LLM使用的责任制和透明度。

编辑部推荐博文
问答之间｜idea被别人做过，要转变方向吗？饮酒与戒酒（二）瓶子酒科学家解开自私的B染色体之谜植物写真\|“森林明珠” 银杉上海交大郭益平课题组：用于结构健康监测和机器人感知的超高灵敏度各向 ... 给课堂以想象的空间更多>>