揭穿 隐形指纹 Nature封面 DeepMind为AI大模型添加了 一切!Google

尽管生成式人工智能(AI)正在改变全球内容生产的格局,但诸多严峻挑战也随之而来: 如何准确识别由 AI 生成的内容并防止其被滥用 ,尤其是在文本生成领域,已成为困扰越来越多人的一大难题。

今天, Google DeepMind 团队 发表了一项重磅研究——

他们开发了一种名为 SynthID-Text 的新型水印工具 。该工具采用“锦标赛抽样”(tournament sampling)算法,在 不损害文本质量的前提下,通过嵌入隐形水印,使大语言模型(LLM)生成的每段文本都带有独特标识,极大提高了文本追踪和检测的精度

研究发现,通过在多个公开可用的模型上评估,SynthID-Text 显示出比现有方法更高的检测率。通过对近 2000 万条 LLM 的实时聊天互动数据进行分析,非扭曲模式的水印并未降低文本质量。

相关研究论文以 “Scalable watermarking for identifying large language model outputs” 为题,以封面文章的形式已发表在权威科学期刊 Nature 上。

这一工具的推出,标志着 AI 文本透明性和责任性的重大进展,为当前 AI 生成内容的溯源和透明性提供了新的解决方案,也回应了当前社会对 AI 内容可信度的担忧。

“揭穿” AI 文本的“隐形指纹”

随着 LLM 技术的发展,像 GPT 系列模型等 AI 工具生成的文本内容流畅度和语言多样性已经接近甚至超越人类编写的文本。然而,这也带来了 ,尤其是在教育、媒体等领域 ,无法辨别生成文本的来源可能会导致误导性信息的传播。

在文本生成的过程中,LLM 将文本分解为 token(最小的语言单位),然后逐步预测下一个 token 的出现概率,然后通过大量语料数据的训练,学习语言的上下文结构,从而实现语言生成。每次预测新的 token,LLM 都基于此前生成的 token 和上下文,逐步构建句子直到完成整段文本。

传统的水印技术往往需要在生成文本中做出一些可察觉的修改,如基于机器学习的分类器和检索式系统,可以在一定程度上检测 AI 生成的内容,但其 在大规模应用时表现欠佳,且误报率较高 。同时, 现有的方法往往存在隐私问题,难以在不影响文本质量的情况下进行大规模应用

图|LLM 文本生成和生成水印概述

SynthID-Text的创新在于引入随机种子生成器和多层次的水印函数,在每次生成 token 时,随机种子会传递给多个水印函数,通过锦标赛的方式选出符合水印要求的最高分词嵌入文本。这种方法确保了生成的文本具备水印特征,同时不会显著影响文本流畅性和多样性。

在 LLM 生成文本时,SynthID-Text 的嵌入技术分为 三个关键步骤

图|SynthID-Text的基于锦标赛的水印

在生成式 AI 应用中,文本质量和多样性至关重要。传统的水印技术可能在嵌入水印的过程中牺牲文本的流畅性,导致生成文本出现语法错误或重复内容。

SynthID-Text 通过非扭曲水印(non-distortionary watermarking)技术优化了这一问题, 这种水印嵌入方法兼顾了生成文本的质量和透明性,确保在不改变生成文本自然性的前提下实现水印标记

研究表明,单词级别的水印嵌入不会改变 LLM 原有的文本生成分布,从而保持了文本的流畅性和多样性。

实验验证:文本质量与水印检测的平衡

研究团队对 2000 万条由 LLM 生成的文本进行了大规模实验,测试了 SynthID-Text 的实际效果。

研究发现,在非失真模式下(即不改变文本结构和语法的情况下),SynthID-Text 几乎不会对生成文本的质量造成任何影响,而且用户对嵌入水印的文本与未嵌入水印的文本的满意度差异仅为 0.01%。这表明, SynthID-Text 能够在不牺牲用户体验的前提下,实现高效的文本水印嵌入

此外,论文分析了 “单 token 非失真性” 的概念,即在特定配置下,水印算法在生成每个 token 时不会影响 LLM 的原始分布。这保证了文本质量的最大程度保留,使水印嵌入对用户体验几乎没有负面影响。

图|SynthID-Text 的检测性能

研究还分析了 SynthID-Text 的水印检测性能主要受文本长度和 LLM 生成文本的熵值(entropy)影响。熵值指的是文本生成过程中语言的多样性,即模型生成新 token 时的选项数目。结果显示, 熵值越高的文本,水印的嵌入和检测效果越好 ;而熵值较低的环境下,水印的嵌入与检测难度则增加。

研究指出,这主要是由于模型生成的文本选项较少,锦标赛抽样算法无法选择最优的水印词。

为了提高水印在低熵环境下的嵌入与检测性能,研究团队提出通过增加锦标赛层数的方法来增强水印检测的可靠性,不过研究也警告, 过多的锦标赛层数可能导致熵值耗尽,从而削弱水印的嵌入效果

因此,在实际应用中,研究建议将锦标赛的层数控制在 30 层以内,以确保检测精度与文本生成的平衡。

不足与展望

尽管 SynthID-Text 在 隐形水印 嵌入方面表现出了显著的优势,但其在某些应用场景下仍存在局限性。 主要挑战包括

对此,研究团队表示,他们计划未来 将水印算法与其他文本生成加速技术(如推测抽样)相结合 ,进一步提升水印嵌入与检测的效率与精度。同时,针对不同熵值下水印表现的深入研究,也将有助于扩展其在更多实际应用场景中的一致性表现。

不止是文字

除了文字, SynthID 还可以为音频、图像和视频添加水印 ,帮助用户确定内容或部分内容是否由谷歌的 AI 工具生成。

据 Google DeepMind 官方博客介绍, 在人工智能生成音乐方面 ,SynthID 将音频波转换为光谱图,二维可视化地展示声音中频率范围随时间的演变。在计算出光谱图后,数字水印被添加到其中,在转换回波形时,利用音频属性确保水印人耳听不到,不影响聆听体验。

在人工智能生成图像和视频方面 ,SynthID 将人眼无法察觉的数字水印直接添加到图像像素或视频的每一帧中。经过精心设计,不影响图像或视频质量,即使经过裁剪、添加滤镜、更改颜色、更改帧速率以及各种有损压缩方案保存等修改,水印依然保持可检测性。

Google DeepMind 表示,通过开源代码,更多的人将可以使用该工具加水印,并确定文本输出是否来自他们自己的 LLM,从而 构建可信的 AI

随着生成式 AI 技术的普及,信息透明性和追踪性变得至关重要。虚假信息的传播不仅威胁着社会稳定,也对企业声誉和个人权益带来了挑战。 SynthID 的推出,不仅为生成式 AI 文本的溯源和透明化提供了技术解决方案,也为应对虚假信息的扩散提供了新思路

据 Gartner 预测,到 2028 年,超过 50%的企业将开始采用专为应对虚假信息设计的产品和技术,而目前这一比例还不到 5%。在未来,像 SynthID 这样的工具或将为各行业提供强有力的保障,帮助社会在信息泛滥的风暴中保持信任和透明。

作者:田小婷 编辑:学术君


google开发的ai是啥样子

Google DeepMind 团队在最新一期《Nature》上发表论文称,其名为 “渣搏阿尔法围棋”(AlphaGo)的人工智能,在没有任何让子的情况下以 5:0 完胜欧洲冠军、职业围棋二段樊麾。 在计算机的发展史,在国际象棋比赛中,计算机战胜人类是重要历史事件,过去了这么多年,人工智能战胜围棋冠军又怎么说明谷歌AI很牛呢?围棋,一直被认为是人类仍然在机器面前能保持优势的游戏之一。 过去20多年来,科技家们一直在试着教会电脑下棋,在1997年,IBM的深蓝曾经打败了国际象棋的世界冠军Garry Kasparov,这成为了人工智能的一座里程碑事件。 但是,围棋比国际象棋还是要复杂得多,国际象棋中,平均每回合有35种可能,一盘棋可以有80回合;相比之下,围棋每回合有250种可能,一盘棋可以长达150回合。 在下国际象棋的时候,计算机可以分析出每一个可能的步骤,从而进行最优选择,但是,围棋可能的步骤是国际象棋的10倍之多。 这也正是围棋人工智能的难点所在。 在过去很卖拆长时间里,最好的计算机连厉害点的业余围棋棋手都下不过。 所以,去年,Facebook就开始打造围棋人工智能,并且在过去6个月里让它可以用最快0.1秒的速度来落子。 负责这项目的人,就坐在里扎克伯格20英尺远的地方。 但是,Google还是快一步。 这场比赛实际上发生在去年十月,但是知道今天,它才在《自然》杂志中披露出来。 David Silver是这项研究的第一作者,在他看来,阿尔法Go的关键不在于简单粗暴的计算出可能步骤,而是近似于人类的“想象力”。 这背后是名为一项名为“深度学习”的大杀器,它让计算机不再是简单地使用计算能力来统计所有数据,而是像人类一样,训练,然后学习。 Silver说,计算机“下围棋需要的极复杂的直觉机制,这种机制以前我们认为只可能存在于人类大脑中。 ”阿尔法Go用了多种“神经网络”并行,并且相互作用。 其中,中梁枣一个叫做“值网络”(value network),来衡量白字和黑子在棋盘上的位置,一个叫做“策略网络”(“policy network” ),会不断地学习此前人类和自己的落子,来选择接下来怎么下。 不仅仅比人类、比起其他机器人同类,阿尔法Go也更加强大。 它和其他人工智能下了500场围棋,只输了1场,甚至在给对手让子的情况下,它也照赢不误。 而Silver说,它比其他人工智能更先进的地方,就在于可以自我学习。 而且,这种机制不仅仅可以用在围棋学习中,阿尔法Go还可以用来解决很多现实问题,比如处理气候模型等。 据消息称,Google的“阿尔法Go”V和现在的围棋世界冠军李世石 (Lee Sedol),将在今年三月正式进行比赛。 在围棋这个古老的、几乎代表了人类智力巅峰的游戏上,机器人和人类究竟谁更强大,答案很快就会揭晓。

google 的人工智能 围棋 使用什么计算机

Google DeepMind 团队在最新一期《Nature》上发表论文称,其名为 “渣搏阿尔法围棋”(AlphaGo)的人工智能,在没有任何让子的情况下以 5:0 完胜欧洲冠军、职业围棋二段樊麾。 在计算机的发展史,在国际象棋比赛中,计算机战胜人类是重要历史事件,过去了这么多年,人工智能战胜围棋冠军又怎么说明谷歌AI很牛呢?围棋,一直被认为是人类仍然在机器面前能保持优势的游戏之一。 过去20多年来,科技家们一直在试着教会电脑下棋,在1997年,IBM的深蓝曾经打败了国际象棋的世界冠军Garry Kasparov,这成为了人工智能的一座里程碑事件。 但是,围棋比国际象棋还是要复杂得多,国际象棋中,平均每回合有35种可能,一盘棋可以有80回合;相比之下,围棋每回合有250种可能,一盘棋可以长达150回合。 在下国际象棋的时候,计算机可以分析出每一个可能的步骤,从而进行最优选择,但是,围棋可能的步骤是国际象棋的10倍之多。 这也正是围棋人工智能的难点所在。 在过去很卖拆长时间里,最好的计算机连厉害点的业余围棋棋手都下不过。 所以,去年,Facebook就开始打造围棋人工智能,并且在过去6个月里让它可以用最快0.1秒的速度来落子。 负责这项目的人,就坐在里扎克伯格20英尺远的地方。 但是,Google还是快一步。 这场比赛实际上发生在去年十月,但是知道今天,它才在《自然》杂志中披露出来。 David Silver是这项研究的第一作者,在他看来,阿尔法Go的关键不在于简单粗暴的计算出可能步骤,而是近似于人类的“想象力”。 这背后是名为一项名为“深度学习”的大杀器,它让计算机不再是简单地使用计算能力来统计所有数据,而是像人类一样,训练,然后学习。 Silver说,计算机“下围棋需要的极复杂的直觉机制,这种机制以前我们认为只可能存在于人类大脑中。 ”阿尔法Go用了多种“神经网络”并行,并且相互作用。 其中,中梁枣一个叫做“值网络”(value network),来衡量白字和黑子在棋盘上的位置,一个叫做“策略网络”(“policy network” ),会不断地学习此前人类和自己的落子,来选择接下来怎么下。 不仅仅比人类、比起其他机器人同类,阿尔法Go也更加强大。 它和其他人工智能下了500场围棋,只输了1场,甚至在给对手让子的情况下,它也照赢不误。 而Silver说,它比其他人工智能更先进的地方,就在于可以自我学习。 而且,这种机制不仅仅可以用在围棋学习中,阿尔法Go还可以用来解决很多现实问题,比如处理气候模型等。 据消息称,Google的“阿尔法Go”V和现在的围棋世界冠军李世石 (Lee Sedol),将在今年三月正式进行比赛。 在围棋这个古老的、几乎代表了人类智力巅峰的游戏上,机器人和人类究竟谁更强大,答案很快就会揭晓。

新版阿法狗碾压旧版,人工智能究竟能发展成什么样?

最新版本阿尔法狗:自学3天,就100:0碾压李世石版旧狗。 这太可怕了,我要大胆说一句:‍‍人工智能很可能导致人类的永生或者灭绝,而这一切很可能在我们的有生之年发生。 ‍‍

这并不是危言耸听,其实人工智能的概念很宽,所以人工智能大体可以分为三种:

第一、弱人工智能:弱人工智能是擅长于单个方面的人工智能。 比如有能战胜象棋世界冠军的人工智能,但是它只会下象棋。

第二、强人工智能:人类级别的人工智能。 强人工智能是指在各方面都能和人类比肩的人工智能,人类能干的脑力活它都能干。

第三、超人工智能:牛津哲学家,知名人工智能思想家Nick Bostrom把超级智能定义为“在几乎所有领域都比最聪明的人类大脑都聪明很多,包括科学创新、通识和社交技能。 ”超人工智能可以是各方面都比人类强一点,也搭唤可以是各方面都比人类强万亿倍的。

这样一分,我们不难看出,现在的人工智能还处在"弱智”阶段。

回到问题,我们会注意到强调的是:新版本、碾压。 这则新闻还有一个点就是自学三天。 说到

这里,我要引出一个沉重的概念:‍‍递归的自我改进。

‍‍‍‍这个概念是这样的:一个运行在特定智能水平的人工智能,比如说脑残人类水平,有自我改进的机制。 当它完成一次自我改进后,它比原来更加聪明了,我们假设它到了爱因斯坦水平。 而这个时候它继续进行自我改进,然而现在它有了爱因斯坦水平的智能,所以这次改进会比上面一次更加容易,效果也更好。 第二次的改进使得他比爱因斯坦还要聪明很多,让它接下来的改进进步更加明显。 如此反复,这个强人工智能的智能水平越长越快,直到它达到了超人工智能的水平---这就是智能爆炸,也是加速回报定律的终极表现。 ‍‍

试想一下:一个人工智能系统花蚂枝肢了几十年时间到达了人类脑残智能的水平,而当这个节点发生的时候,电脑对于世界的感知大概和一个四岁小孩一般;而在这节点后一个小时,电脑立马推导出了统一广义相对论和量子力学的物理学理论;而在这之后一个半小时,这个强人工智能变成了超人工智能,智能达到了普通人类的17万倍。‍‍

‍‍当一个超人工智能出生的时候,闷世对我们来说就像一个全能的上帝降临地球一般。‍

  • 声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
  • 本文地址:https://m.srwj168.com.cn/jinrong/27090.html
Mac重大变革!苹果本周将发布多款M4处理器电脑
魅族撞档小米发布会 10月29日见