开端:MIT Technology Review
这款名为 SynthID 的器具,是生成式 AI 输出水印器具家眷的一部分。客岁,公司推出了用于图像的水印,随后又推出了用于 AI 生成视频的水印。本年 5 月,Google 晓示在其 Gemini 垄断和在线聊天机器东说念主中使用 SynthID,并在 Hugging Face 这一灵通的 AI 数据集和模子库中免费提供。水印已成为匡助东说念主们识别 AI 生成骨子的热切器具,这有助于顾惜如过错信息等潜在危害。
“现时,其他生成式 AI 建树者不错使用这一时代,匡助他们检测文本输出是否来自我方的大谈话模子,这将使更多建树者大致更负株连地构建 AI。”Google DeepMind 筹议副总裁 Pushmeet Kohli 说。
SynthID 通过在 AI 模子生成文本时,平直在文本中加入一个弗成见的水印。
大型谈话模子通过将谈话明白为“token”,然后沟通哪个 token 最有可能接在前一个 token 之自后运作。一个 token 不错是单个字符、单词或短语的一部分,每个 token 齐会获取一个百分比分数,示意其成为句子中下一个词的可能性。百分比越高,模子使用该 token 的可能性就越大。
“SynthID 通过在生成的那一刻引入稀薄的信息来改动 token 生成的概率。”Kohli 解说说念。
要检测水印并细目文本是否由 AI 器具生成,SynthID 通过比拟带水印和不带水印文本中单词的预期概率分数来收场。
Google DeepMind 发现,使用 SynthID 水印并未影响生成文本的质料、准确性、创造力或生成速率。这一论断来自 SynthID 在 Gemini 产物中的大范畴实地测试,数百万东说念主使用了带有水印的文本。Gemini 允许用户对 AI 模子的复兴进行评分,选拔“赞”或“踩”。
Kohli 和他的团队分析了约 2000 万条带水印和不带水印的聊天机器东说念主复兴的评分。他们发现,用户并未察觉两者在质料和实用性上有何差别。这次施行的收尾详见今天发表在 Nature 上的论文。现时,SynthID 仅适用于 Google 的模子生成的骨子,但开源这一器具的目的是但愿扩大其兼容器具的范围。
关连词,SynthID 也存在一些局限性。水印在移交文本编著、轻度编著或重写时具有一定的抗搅扰才略,但当 AI 生成的文本被重写或翻译成另一种谈话时,成果不如预期。在回答诸如“法国的齐门是何处”这种事实性问题时,水印的可靠性也较低。原因在于,在不改动事实的前提下,革新句子中下一个可能单词的概率空间更为有限。
“在生成式 AI 文本中收场可靠且弗成察觉的水印是极具挑战性的,尤其是在输出收尾接近细目性的场景中,举例事实性问题或代码生成任务。”马里兰大学副讲授 Soheil Feizi 说,他曾筹议过 AI 水印的脆弱性。
Feizi 示意,Google DeepMind 决定开源其水印法子,是对 AI 社区的一个积极信号。“这让社区不错测试这些检测器,并在不同的环境中评估其鲁棒性,从而更好地见识这些时代的局限性。”他补充说念。
Hugging Face 的机器学习工程师 João Gante 指出,开源器具还有另一个公道,开源意味着任何东说念主齐不错使用代码,并无附加截止地将水印整合到他们的模子中。这将提高水印的狡饰性,因为独一领有者知说念其加密好意思妙。
“跟着可造访性的提高和功能的考证,我但愿水印时代能成为圭臬,这有助于咱们检测谈话模子的坏心使用。”Gante 说说念。
但水印并非全能的处理决议,Hugging Face 大家策略厚爱东说念主 Irene Solaiman 指出。
“水印是保险模子安全的一部分,但通盘这个词生态系统还需要好多互补的安全设施。一样地,即就是东说念主工生成的骨子,事实核查的成果也因情境而异。”她示意。
原文连接:
https://www.technologyreview.com/2024/10/23/1106105/google-deepmind-is-making-its-ai-text-watermark-open-source/
Google水印模子文本token发布于:北京市声明:该文不雅点仅代表作家本东说念主,搜狐号系信息发布平台,搜狐仅提供信息存储空间功绩。CLOSEThis is a modal window.
Beginning of dialog window. Escape will cancel and close the window.
TextColorWhiteBlackRedGreenBlueYellowMagentaCyanOpacityOpaqueSemi-TransparentText BackgroundColorBlackWhiteRedGreenBlueYellowMagentaCyanOpacityOpaqueSemi-TransparentTransparentCaption Area BackgroundColorBlackWhiteRedGreenBlueYellowMagentaCyanOpacityTransparentSemi-TransparentOpaqueFont Size50u0505 000@0%Text Edge StyleNoneRaisedDepressedUniformDrop shadowFont FamilyProportional Sans-SerifMonospace Sans-SerifProportional SerifMonospace SerifCasualScriptSmall CapsResetDoneClose Modal DialogEnd of dialog window.