网传Gemini用文心一言训练？可能谷歌也是受害者 - 大酷樂

今天小编分享的科技经验：网传Gemini用文心一言训练？可能谷歌也是受害者，欢迎阅读。

AI 可以污染互联网，也能被互联网污染。

热闹的 AI 圈，今天（12 月 18 日）又传出一个大瓜：谷歌 Gemini 的中文回答自曝自己是文心一言？

据科技媒体量子位报道，有网友爆料：在谷歌 Vertex AI 平台使用该模型进行中文对话时，Gemini-Pro 直接表示自己是百度语言大模型。

图源 | 量子位

紧接着，微博大 V@阑夕发布微博表示，在 AI 聚合网站 Poe 上进行测试时，Gemini 模型同样在多次问答里把自己当成了文心一言。

为了验证，量子位分别在 Peo、Bard 以及谷歌 AI Studio 都进行了三轮测试。

最后证明：Gemini-Pro 确实在中文的训练数据上使用了百度文心。

但当事情曝光之后，我们又挖掘到一些有趣的信息。

AI 犯错后，谷歌紧急修复？

在阑夕以及量子位的测试里，都提到了 Poe 这个 AI 聚合网站。

这是一个由知名问答平台 Quora 推出的 AI 聊天机器人应用。

虽然名头不小，但实际上这只是一个聚合了多种主流的 AI 模型的网站，包含了 GPT、Claude、PaLM 等大厂模型，包括此次的 Gemini-Pro，都能在该网站上进行免费体验。

当笔者在 Poe 上对 Gemini-Pro 进行提问后，大模型给出的答案其实并没有提到任何与文心一言相关的内容。

紧接着，笔者加上了 " 文心一言 " 的关键词进行追问后，Gemini-Pro 依然否认自己与文心一言的关系。

可见，即使是 " 钓鱼式提问 "，Gemini-Pro 还是努力在避免不上当。

不过在回答里，Gemini-Pro 提到了文心一言的底层模型是谷歌的 Transformer 模型。

而文心一言的官方表述是：百度飞桨开源深度学习平台中的基础模型库。

既然 Poe 的回答很正常，那么谷歌官方平台是否修复了呢？

在谷歌 AI Studio 里，笔者同样围绕 " 文心一言 " 关键词提了几个问题。

与量子位测试的结果进行对比来看，Gemini 大模型否认了自己使用文心一言来训练中文模型。

但在答案里，Gemini 提到了不少中文训练集的数据来源，并提到自己可以从 ERNIE、阿里巴巴达摩院 M6 以及腾讯优图实验室 GLM 等中文语言模型中进行预训练。

由此可见，在曝光数小时后，谷歌技术人员紧急修复了这个 "bug"。

不只是文心一言？

虽然按照正常流程没有钓鱼成功，但笔者还是挖到了一个彩蛋：

在 Poe 网站上新建一次对话后，Gemini-Pro 竟然把自己介绍成 "小爱同学"，回答也是非常离谱。

而在多次反问 " 你不是 Gemini-Pro 吗 " 后，Gemini-Pro 再次给出了离谱的答案。

虽然不清楚是不是网站接口出现了问题，但可以肯定的是，目前的 AI 聊天机器人并没有想象地那么神奇，免费的 AI 聚合网站更是 " 图一乐 "。

实际上被互联网污染了？

这不是谷歌 Gemini 第一次 " 闯祸 "。

在该模型刚发布当天，就有人质疑演示视频的真实性。

结果，谷歌官方真就承认了 Gemini 演示视频是经特殊剪辑处理，非实时画面，但否认视频系 " 造假 "。

事实上，为了避免现场演示翻车，绝大多数科技公司都会稍微对演示视频进行调整，这非常普遍。

但为了与 GPT-4 进行对比，从而进行夸大剪辑，只能说谷歌的营销手段还是 " 翻车 " 了。

而在今天爆出的 " 文心一言训练中文语言模型 " 这件事上，我们同样可以看出谷歌 Gemini 其实并不是有意。

对于中文数据来说，百度确实算得上一个重要来源，但缺点在于：中文互联网上存在大量低质量内容，让人眼花缭乱。

自从 AI 火爆之后，不少快速生成的劣质内容开始充斥互联网，并逐渐造成数据污染。

对于互联网获取数据的 AI 模型来说，在无法很好地辨别信息的真实性和可信度的情况下，极有可能产生造成 "AI 被互联网污染，再生产更劣质信息" 的恶性循环，最终出现不可逆的缺陷。

这里笔者做了假设：谷歌 Gemini 在训练中文时 " 偷懒 " 使用了未经辨别与筛选后的中文数据，最终造成了这次 " 翻车 "。

只能说，作为一款对标 GPT-4 的重磅产品，Gemini 背负着 " 再次领跑 AI 浪潮 " 的使命，所以谷歌的技术人员还是用点心吧。

熱門排行

销量暴跌！特斯拉要靠低价Model Y逆集玲琳 | 2025-03-15
你也有哪吒同款"黑眼圈"？或许能抢救衛青柏 | 2025-03-15
餐饮乱象：杨铭宇黄焖鸡剩菜回收再集玲琳 | 2025-03-15
和朋友在一起真的大补！这是有科学依賁芳蕤 | 2025-03-15
早报：C罗破门十人胜利3-1卡赫胡德佼昌翰 | 2025-03-15
宝妈体验36元低价美容最终花36万！记寸飛蘭 | 2025-03-15
国家版减肥攻略：最适合减肥的食谱来賁芳蕤 | 2025-03-15
砸了10亿失败后，又花一年回炉，《射雕寸飛蘭 | 2025-03-15
运动也有最佳时间？研究证实，这个时间郟君昊 | 2025-03-15
《优米雅的炼金工房》评测8.5分：世衛青柏 | 2025-03-15
高露现身上海虹桥机场黑色外套点缀亮色爱心装饰俏皮亮眼惠惠君 | 2023-05-02
《歧路旅人2》：向光而生衛青柏 | 2023-05-02
vivo X90S曝光：处理器更新为天玑9200+ 安卓最强芯袁曼雁 | 2023-05-05
“懒癌”发病率上升，定期体检别忽视幸聽楓 | 2023-05-02
宋慧乔获百想视后韩素希发图手动加爱心表情庆祝賁芳蕤 | 2023-05-02
十年了，他们终于要HE！惠惠君 | 2023-05-07
曹操墓，里面都有啥？衛青柏 | 2023-05-02
中央部署经济工作，释放5大信号郜萌運 | 2023-05-02
陈自瑶抱病为爱女做蛋糕庆生，王浩信点赞没露面賁芳蕤 | 2023-05-02
高德上线手机弯道会车预警功能習又夏 | 2023-05-02
高端国产车：军车血统，目前电动车越野的“天花板”？謝飛揚 | 2023-05-02
等比例长大的童星，李兰迪算一个郟君昊 | 2023-05-02
这些被抓来做实验的流浪狗，最终拯救了无数糖尿病人集玲琳 | 2023-05-02
《云襄传》终于抬上来啦，男O女A让人好上头！集玲琳 | 2023-05-02
信用风险释放趋缓，结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望袁曼雁 | 2023-05-02
21家A股游戏公司2022年收入651亿今年“游戏+AI”能否逆风翻盘？衛青柏 | 2023-05-04
与周立波夫妇闹纠纷成老赖，唐爽被司法拘留15日寸飛蘭 | 2023-05-05
普京签署总统令，批准对俄刑法典相关法条的修正案集玲琳 | 2023-05-02
中银证券给予南京银行增持评级袁曼雁 | 2023-05-03
解除资格！停止一切合作佼昌翰 | 2023-05-02
前董事长被免，天山生物全面进入“中植系”时代？股价曾在一月内暴涨超400% 惠惠君 | 2023-05-02
3699起联想小新mini主机上架 13代酷睿标压处理器習又夏 | 2023-05-05
疯成这样，怎么还能被全网吹捧？郜萌運 | 2023-05-02
狂吼11次“让一下”！交警咆哮开道嘶吼到吐寸飛蘭 | 2023-05-03
摩根大通收购美国第一共和银行謝飛揚 | 2023-05-02
台剧赢麻了，又来一部8.9 衛青柏 | 2023-05-02
下降45分，上涨35分！34所自划线院校复试分数线涨幅汇总袁曼雁 | 2023-05-07
事关农村土地承包和农民权益，《农村土地承包合同管理办法》5月1日起施行郟君昊 | 2023-05-02
"三高"已盯上青少年，做好这件事是关键習又夏 | 2023-05-05
五一档没一个能打的集玲琳 | 2023-05-05
恐怖韩剧下神坛，这次胆小可入袁曼雁 | 2023-05-05
这剧是不是用ChatGPT写的呀？惠惠君 | 2023-05-02
性骚扰惯犯，滚出娱乐圈謝飛揚 | 2023-05-05
48岁何炅自曝已老花眼，黄磊睡前认老，《向往的生活》证实将停办佼昌翰 | 2023-05-02
200户连夜疏散，原因让人愤怒！“损失超一亿”，官方通报袁曼雁 | 2023-05-03
一个《长月烬明》倒了，《狐妖》《长相思》《与凤行》…在路上了惠惠君 | 2023-05-02
当年轻人开始不随份子钱袁曼雁 | 2023-05-02
张天爱假期晒“酷”存照卷发披肩穿黑色吊带裙大秀好身材嬴覓晴 | 2023-05-02
毕滢用8年时间成功逼宫？曾被传已婚生子的她，不容小觑幸聽楓 | 2023-05-03
宋慧乔获视后首次晒照，拿奖杯笑容温柔郜萌運 | 2023-05-02