大酷樂
  • 汽车
  • 理财
  • 军事
  • 科技
  • 游戏
  • 互联网
  • 娱乐
  • 财经
  • 科学
  • 社会
  • 亲子
  • 电影
  • 健康
  • 教育
  1. 首頁
  2. 科学

AI一本正经地胡说八道,有种办法可以识破它

2024-12-23 简体 HK SG TW

今天小编分享的科学经验:AI一本正经地胡说八道,有种办法可以识破它,欢迎阅读。

近年来,生成式人工智能在文本、影像、音乐等领網域大放异彩。然而,随着生成式人工智能变得越来越强大,人们越来越难以鉴别 AI 生成的内容。

近日,Google DeepMind 研究团队在《自然》(Nature)上发表的封面文章提供了一种文本水印方案,可以提高 AI 生成文本的检测精度。

图库版权图片,转载使用可能引发版权纠纷

AI 生成内容检测的必要性

在文本、影像和音乐中,AI 生成的文本是最难以检测的。因为现有的影像和音乐生成技术尚未像文本生成技术一样发达,AI 生成的影像和音乐往往有某些非自然的视觉或听觉特征。AI 生成的内容在整体上效果较好,但具体到细节就显得不够自然。在影像和音乐中,也可以人工添加人类难以发现的水印,在后期检测中通过水印筛选出 AI 生成的作品。

然而在文本中难以直接添加人类不可见的水印,这是因为文本与影像和音乐不同,每一个文字都是完全可见的。同时,可用于训练 AI 的文本数据也远多于影像和音乐。在庞大的、基于人类写作的语料库的训练之下,AI 已经非常擅长模拟人类的表达方式和语言习惯,甚至能够调整文本的风格和语气,这使得 AI 生成的文本难以直接检测。

尽管 AI 生成的文本与人类创作的文本难以分辨,但 AI 生成的内容可能带有事实性的错误,并不能保证可靠性。无法辨别来源的内容可能会导致虚假信息的传播,也带来了学术作弊、版权争议等种种问题。

比如,在 " 杭州取消机动车依尾号限行 " 假新闻事件中,网友用 AI 技术生成的 " 假新闻 " 行文严谨、语气措辞得当,也基本符合官方通报的格式,导致了错误信息大规模传播。美国科技新闻网站 CNET 在三个月之内上线了 70 多篇用 AI 技术生成的新闻报道,却被发现其中存在大量基础性错误,包括计算错误、金融概念误解等,不得不暂时叫停 AI 项目重新审核。

为了避免 AI 技术的滥用,我们需要一种方法辨别文本是否由 AI 生成。

主流检测方法:事前与事后检测

检测 AI 生成的文本是一个分类问题,我们的主要目标是区分一个文本片段是由 AI 生成的还是由人类创作的。通常一个文本检测器对于一个给定的文本片段会给出一个评分,当这个评分超过阈值时,这个片段被认为是 AI 生成的,反之则是人类创作的。

文本检测框架(图片来源:根据参考文献   [ 1 ]   翻译)

现有的主流检测方法可以分为两大类:事前检测和事后检测。事前检测可以进一步分为基于水印的检测和基于检索的检测。事后检测可以分为基于零样本学习的检测和基于训练的检测。

主流检测方法分类(图片来源:根据参考文献   [ 1 ]   翻译)

1

事前检测

基于水印的检测是指在 AI 生成的文本中隐藏某些信息以便后续检测。但由于文本的离散性,在文本中添加水印比在影像和音乐中添加水印困难很多。常用的方法是让 AI 生成的文本使用特定的语言风格或者偏向性地使用某些特定的词汇,但这样可能会降低 AI 生成文本的质量。

基于检索的方法是指 AI 服务的提供者将用户通过 AI 生成的文本保存在数据库中。当需要检测目标文本是否由 AI 生成时,将目标文本与数据库中的文本进行匹配,如果相似度较高,则很可能是 AI 生成的。但这种方法需要保存用户数据,可能带来隐私泄露的问题。

2

事后检测

基于零样本学习的检测是指不需要进行任何的训练,仅根据 AI 生成文本的特点来检测一段文本是否是 AI 生成的。通常 AI 生成的文本倾向于使用常见的词汇,句子的长度和结构也更加统一。而人类创作的文本则显得更加随心所欲,每一句的水平也参差不齐。与人类相比,AI 在记忆细节上能力较强而在逻辑推理上能力较弱。利用这些特点可以在一定程度上区分 AI 生成的文本和人类创作的文本。

基于训练的检测是指使用人类创作的文本和 AI 生成的文本构建一个数据集,用这个数据集训练一个分类器来识别 AI 生成的文本。但这需要收集足够的数据用于训练,并且随着 AI 能力的进步,这样的区分也变得越来越困难。

可以看到,事后检测比事前检测要困难许多。为了高精度地筛选出 AI 生成的文本,在事前 AI 生成文本时就添加水印是一个很好的解决方案。

Google DeepMind 的突破:

SynthID-Text 水印技术

Google DeepMind 研究团队提出了一种新的水印生成方案,称为 SynthID-Text。它基于之前的水印生成组件,但使用了一种新的 " 锦标赛采样 " 方法。SynthID-Text 可以非扭曲(保留文本质量)或者扭曲(以牺牲文本质量为代价提升水印的可检测性)地添加水印。在扭曲和非扭曲設定下,与现有的最佳方法相比,SynthID-Text 都提升了水印的检出率。

水印生成框架(图片来源:根据参考文献   [ 2 ]   翻译)

上图中展示了大语言模型生成文本的原理以及之前水印生成的框架。大语言模型的文本生成是基于上下文的,它会根据输入的文本序列计算下一个词汇的分布,然后从这个分布中抽样出下一个词汇。

一个生成式的水印方案通常包含三个部分:一个随机数生成器、一个采样算法以及一个评分函数。水印生成的过程是:首先使用随机数生成器根据前面的文本以及水印键生成一个随机数,然后采样算法利用这个随机数从词汇的分布中抽样出下一个词汇。给出一段文本以及一个水印键,评分函数提供一个分数来量化当前文本中含有水印的可能性,当分数超过一个阈值时就认为这段文本中含有水印。

锦标赛采样(图片来源:根据参考文献 [ 2 ] 翻译)

SynthID-Text 提出了一种新的 " 锦标赛采样 " 方法,上图是锦标赛采样方法的一个例子。当向模型输入 "... 我最喜欢的热带水果是 " 时,模型计算出下一个词汇的分布,其中 " 芒果 " 的概率是 0.5," 荔枝 " 的概率是 0.3," 木瓜 " 的概率是 0.15," 榴莲 " 的概率是 0.05。在不加水印的正常生成中,模型会按这个概率直接采样出下一个词汇。

在锦标赛采样中,模型先根据随机数种子生成三个随机的水印函数,然后再从词汇的分布中采样出八个词汇,将这八个词汇两两组合后进行竞赛,在每一轮竞赛中,由一个水印函数决定每一对组合中的胜出者。经过三轮竞赛后,最终的胜出者就是模型的输出结果:" 芒果 "。

在锦标赛采样中,词汇是根据水印函数的偏好采样得出的。因此添加水印的文本会在水印函数上有更高的评分。在检测时只需要评估每个词汇在对应的水印函数下的评分,再将评分加和就可以得到这段文本包含水印的可能性。

水印的添加是通过改变采样方法实现的,它会改变模型输出下一个词汇的分布,这看起来不可避免地会影响生成文本的质量。然而,由于采样方法中使用了随机数种子,尽管在某一随机数种子下词汇的分布会被改变,但在对所有随机数种子进行平均后可以得到和原始分布相同的结果。SynthID-Text   可以在适当的配置下避免影响词汇的分布从而保证文本的质量,也可以以损失一部分质量为代价提高水印的检出概率。

SynthID-Text 方法在 Google DeepMind 推出的 Gemini 人工智能模型上经过了两千万次用户测试。测试结果表明 SynthID-Text 在添加水印的同时并不会降低文本的质量。同时,SynthID-Text 不会产生太多的时间和计算开销,可以被大规模地应用于生产实践之中。

结语

事后检测文本是否由 AI 生成是非常困难的。随着 AI 能力的增强,事后检测会变得越来越困难,检测和反检测将会是无止境的技术竞赛。水印方法提供了一种可能的解决方案,但这需要大语言模型的提供者在生成时就预先加入水印。如果用户使用的模型没有主动加入水印,就难以在事后进行检测。此外,用户还可以使用开源模型,或者对添加了水印的文本进行二次编辑来逃脱检测。这些问题都有待进一步解决。

未来,随着生成式人工智能的普及,如何检测 AI 生成的内容会变得越来越重要。SynthID-Text 证明了水印技术在文本生成中大规模应用的可能性,但水印技术面临的困难也说明检测并不只是一个技术问题。解决这个问题还需要各方共同努力,形成相关的行业标准以及法律法规,从而推动 AI 走在为人类服务的正轨之上。

参考文献

[ 1 ] Ghosal S S, Chakraborty S, Geiping J, et al. Towards possibilities & impossibilities of ai-generated text detection: A survey [ J ] . arXiv preprint arXiv:2310.15264, 2023.

[ 2 ] Dathathri, S., See, A., Ghaisas, S., Huang, P. S., McAdam, R., Welbl, J., ... & Kohli, P. ( 2024 ) . Scalable watermarking for identifying large language model outputs. Nature, 634 ( 8035 ) , 818-823.

策划制作

出品丨科普中国

作者丨王琛 中国科学院计算技术研究所在读博士

审核丨于旸 腾讯玄武实验室负责人

监制丨中国科普博览

责编丨钟艳平

审校丨徐来 林林

相关推荐

1.石头居然长出了头发?!不过真相比你想的更可怕……

2." 多喝水 " 真的有用!最新研究显示:多喝水有助于减肥、治疗肾结石……

3.为什么女性总爱喊疼?真不是矫情,而是……

4.冬天必吃的神仙菜!营养美味还抗癌,答应我一定要试试

5.为什么我不建议你,凡事都和伴侣 " 掏心掏肺 "?

本文封面图片及文内图片来自版权图库

转载使用可能引发版权纠纷

原创图文转载请后台回复 " 转载 "

点亮 " 在看 "

一起涨知识!

熱門排行
  • 王治郅:杨瀚森主要的问题是速度 他 王治郅:杨瀚森主要的问题是速度 他 郟君昊 | 2025-05-05
  • 贸易战烧进电影院:特朗普拟重税打击 贸易战烧进电影院:特朗普拟重税打击 習又夏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天 贷款追高炒黄金的人后悔了!有人一天 寸飛蘭 | 2025-05-05
  • 手机电池突破8000mAh?硅碳技术的回 手机电池突破8000mAh?硅碳技术的回 衛青柏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天 贷款追高炒黄金的人后悔了!有人一天 繁綺文 | 2025-05-05
  • 任天堂对Genki提起Switch 2商标侵 任天堂对Genki提起Switch 2商标侵 郜萌運 | 2025-05-05
  • 哪吒汽车APP和官网恢复正常 知情人 哪吒汽车APP和官网恢复正常 知情人 袁曼雁 | 2025-05-05
  • 极越汽车 CEO 夏一平名下青岛/义乌 极越汽车 CEO 夏一平名下青岛/义乌 集玲琳 | 2025-05-05
  • 全国经济第一大省明确,推动组建农商 全国经济第一大省明确,推动组建农商 佼昌翰 | 2025-05-05
  • 桑保利:亚马尔有配合意识&有点像梅 桑保利:亚马尔有配合意识&有点像梅 甄正浩 | 2025-05-05
  • 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 袁曼雁 | 2023-05-05
  • “懒癌”发病率上升,定期体检别忽视 “懒癌”发病率上升,定期体检别忽视 幸聽楓 | 2023-05-02
  • 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 賁芳蕤 | 2023-05-02
  • 曹操墓,里面都有啥? 曹操墓,里面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他们终于要HE! 十年了,他们终于要HE! 惠惠君 | 2023-05-07
  • 中央部署经济工作,释放5大信号 中央部署经济工作,释放5大信号 郜萌運 | 2023-05-02
  • 高德上线手机弯道会车预警功能 高德上线手机弯道会车预警功能 習又夏 | 2023-05-02
  • 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 賁芳蕤 | 2023-05-02
  • 等比例长大的童星,李兰迪算一个 等比例长大的童星,李兰迪算一个 郟君昊 | 2023-05-02
  • 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 集玲琳 | 2023-05-02
  • 高端国产车:军车血统,目前电动车越野的“天花板”? 高端国产车:军车血统,目前电动车越野的“天花板”? 謝飛揚 | 2023-05-02
  • 《云襄传》终于抬上来啦,男O女A让人好上头! 《云襄传》终于抬上来啦,男O女A让人好上头! 集玲琳 | 2023-05-02
  • 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 衛青柏 | 2023-05-04
  • 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 袁曼雁 | 2023-05-02
  • 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 寸飛蘭 | 2023-05-05
  • 普京签署总统令,批准对俄刑法典相关法条的修正案 普京签署总统令,批准对俄刑法典相关法条的修正案 集玲琳 | 2023-05-02
  • 解除资格!停止一切合作 解除资格!停止一切合作 佼昌翰 | 2023-05-02
  • 中银证券给予南京银行增持评级 中银证券给予南京银行增持评级 袁曼雁 | 2023-05-03
  • 3699起 联想小新mini主机上架 13代酷睿标压处理器 3699起 联想小新mini主机上架 13代酷睿标压处理器 習又夏 | 2023-05-05
  • 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 惠惠君 | 2023-05-02
  • 疯成这样,怎么还能被全网吹捧? 疯成这样,怎么还能被全网吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收购美国第一共和银行 摩根大通收购美国第一共和银行 謝飛揚 | 2023-05-02
  • 台剧赢麻了,又来一部8.9 台剧赢麻了,又来一部8.9 衛青柏 | 2023-05-02
  • 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 郟君昊 | 2023-05-02
  • 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好这件事是关键 "三高"已盯上青少年,做好这件事是关键 習又夏 | 2023-05-05
  • 五一档没一个能打的 五一档没一个能打的 集玲琳 | 2023-05-05
  • 恐怖韩剧下神坛,这次胆小可入 恐怖韩剧下神坛,这次胆小可入 袁曼雁 | 2023-05-05
  • 这剧是不是用ChatGPT写的呀? 这剧是不是用ChatGPT写的呀? 惠惠君 | 2023-05-02
  • 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 袁曼雁 | 2023-05-03
  • 性骚扰惯犯,滚出娱乐圈 性骚扰惯犯,滚出娱乐圈 謝飛揚 | 2023-05-05
  • 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 佼昌翰 | 2023-05-02
  • 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 惠惠君 | 2023-05-02
  • 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 嬴覓晴 | 2023-05-02
  • 当年轻人开始不随份子钱 当年轻人开始不随份子钱 袁曼雁 | 2023-05-02
  • 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 幸聽楓 | 2023-05-03
  • 宋慧乔获视后首次晒照,拿奖杯笑容温柔 宋慧乔获视后首次晒照,拿奖杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們