愚人节特辑：AI比你想象得更蠢

今天小编分享的科学经验：愚人节特辑：AI比你想象得更蠢，欢迎阅读。

前几年提到人工智能，网上的主流说法是管它叫 " 人工智障 "。但这两年，随着大模型技术的突飞猛进，各类 AIGC 能力层出不穷。曾经轻视 AI 的大家，逐渐在各路专家、大 V、营销号对 AI 的热捧中感觉有点晕乎。

" 这 AI 好像还真挺厉害啊 "" 让我随便写几千字的论文可做不到啊 "" 让我随便画张宫崎骏我也不行 "" 咱们怕不是真要被 AI 取代了吧 " ——这类褒奖 AI，进而对未来产生迷惘的言论开始激增。

从最初的调侃，到某个时间点真的动了心思。我们似乎开始认真思考是否 AI 觉醒会给接下来的生活工作带来冲击。学习是不是没用了？工作是不是不好找了？是不是真的要在社交媒体上发一句 "AI 大神我是自己人，将来在人类监狱里给我留个好位置 "？

既然大伙有点急，那就先别急。在愚人节这个春风拂面的日子里，我们不妨给自己来点安慰剂，一起看看那些依旧蠢到爆炸，但依旧占据主流市场的 AI 技术。

看完之后你会发现，AI 那么蠢，到底怕它个啥？

DeepSeek 爆火之后，大家很快就发现它有个最大的问题，就是这幻觉也忒严重了。根据 Vectara 发布的大模型幻觉排行榜，DeepSeek-R1 的幻觉率达到了 14.3%，在主流大模型里已经属于非常高的水平了。

高幻觉率带来的体验感受，就是我们经常会发现 DeepSeek 给出的各种信息都是它瞎编的。推荐的店铺是不存在的，给出的文献是 AI 捏造的，提出的专业观点是信口胡诌的，最可气的是大模型编的还有鼻子有眼的。编造的历史文献居然还有朝代、有作者，上下文的文言文也没问题，简直防不胜防。

事情发展到这里，我们可能还主要是感叹 AI 挺厉害，不仅知道得多，骗人也这么有水平。但如果换个角度想想，我们就会发现大语言模型其实非常蠢：它胡编乱造的这些信息，都是从哪来的呢？

答案是，AI 绝大部分时间都是被人类忽悠瘸的。

大语言模型为了保证信息的时效性，在今天一般都会加入联网搜索机制。即让 AI 来进行信息检索，再将检索到的信息整理给用户。这里的问题在于，AI 检索到的信息都是互联网公开内容，换言之就是每个人都能随便写，营销号可以随便发的内容。这样一来，问 AI 和直接看这些虚假信息就没区别了，只不过加一道 AI 滤镜，很多人反而就信了。

我们可以注意一下大模型进行联网检索时提供的参考联接，其中大部分都不来自权威平台、权威作者，缺乏信源支撑。

更要命的是，想要用信息污染大模型在今天是非常容易的，只要换两个平台发布两个观点近似，但标题不一的文稿，大模型很容易采信你刚刚瞎编的说法。

更进一步的玩法是，可以用大模型生成虚假内容，发布之后再污染其他大模型。用大模型生成内容作为证据，再去发布更多内容。周而复始，虚假信息可以在自媒体平台与大模型幻觉之间形成一个莫比乌斯环，让辟谣的人跑断腿也解不开。

大语言模型特别好骗这件事，已经变成了一个急待修补的漏洞，开始被不法分子钻营。最关键的是污染 AI 这个办法，还特别容易骗到年轻人。很多年轻人一边反感长辈被微信群里的养生信息忽悠，一边问跟大模型求医问药。

咱们呐，是谁也别想好。

前几天我买了一台某品牌今年最新型号的扫地机器人。家电嘛，到 2025 年了没有不加 AI 的。这台扫地机主打的也当然是 AI 能力，尤其是依靠机器视觉来进行路线规划和避障。

然而就在它上岗的第一天，问题还是发生了。它工作一阵之后，我突然发现它在客厅门口无尽徘徊，既不工作，也不回去充电清洗，更没被东西缠住。打开 APP 之后才发现，它是把客厅门槛地垫上的图案识别成了线团。怕被缠住所以不能前进，但这种情况也没有绕过或者其他选项。它只能可怜巴巴地在地垫身边徘徊，徘徊，徘徊，一直徘徊了俩小时，没电了。

这种愚蠢的现象，其实普遍发生于今天所有机器视觉类的 AI 技术里。

机器视觉的一大 " 原罪 "，在于它的基本实现路径是模糊比对。即对比两种物体有多少相似的视觉信息点，如果达到一定比率就对比成功。

但问题在于，AI 会把真猫和画出来的猫当作同一种东西。于是地板上有个图案，机器人也会停步不前。同时，还可能把路标和加了一些像素点的路标当作截然不同的两种东西。前方有限速标识，但只要在标识上加一点干扰自动驾驶汽车就会猛冲过去，这就是对机器视觉的对抗生成攻击法。

缺乏 3D 视觉能力，特别容易被干扰，以及误判率过大等问题，让机器视觉常年处在看啥都是幻觉的乱吃菌子状态。

购买 AI 产品，或者企业引入 AI 能力时一定要想清楚：AI 的视力可跟你的视力不一样。

早几年，语音助手有个饱受诟病的问题，就是难以识别方言。怎么着，中国这么大，我想用个数码设备还得先练好普通话？字正腔圆播音腔跟你一个 AI 聊天？想什么呢？

于是乎，这几年智能语音方案的供应商快马加鞭，终于基本实现了方言识别的问题，今天已经很难找到只支持普通话识别的语音助手。

但是问题真解决了吗？并没有。如果我们留心一下，就会发现方言识别这个 AI 能力普遍存在一个巨大的问题，就是它需要慢速，且清晰地讲出方言，才能完成互動。

那么来自五湖四海的小伙伴可以回想一下了，我们大部分人的家乡方言，语速比普通话快还是慢？真的会像普通话教育里要求的一样咬字清晰，四声分明吗？

平时对着电视、手机、音箱讲话可能还好，但在车载场景、家务场景、运动场景里，要求慢速清晰讲方言简直就是个悖论。于是我们能看到全国各地怒怼导航，怒骂语音助手的群体狂欢。

有时候真不怪大哥大姐脾气暴。当你第十次对一台设备说出需求，然而换来还是那句：对不起，我没有听清，请您再说一次。小 X 很高兴为您服务。

这时你可能只想说一句：握是嫩蝶。

除了人类之外，你的家里还有多少会说话的东西？

十年前这句话可能是想讲个鬼故事，但现在大家可能真的已经算不清楚了。电视、手机、音箱、扫地机会说话还则罢了。冰箱、洗衣机、电饭煲、马桶会说话到底是为了什么？为了给家里制造一点活泼紧张，略显灵异的氛围吗？

原本这种情况已经够离谱了，今年开始更是离离原上谱。大模型爆火之后，所有白家电、黑家电、小家电都想给自己加大模型，反正开源的不要钱，还能蹭个热度。但最后的结果是，冰箱、洗衣机、洗碗机、抽湿机，都想跟你山南海北地聊上一顿，跟你输出个几百字上千字的内容感悟。家里住了十几二十位小 X，XX，XY 已经很烦躁了，这些位都化身话痨了可真是攒劲得很。