今天小编分享的科学经验:愚人节特辑:AI比你想象得更蠢,欢迎阅读。
前几年提到人工智能,网上的主流说法是管它叫 " 人工智障 "。但这两年,随着大模型技术的突飞猛进,各类 AIGC 能力层出不穷。曾经轻视 AI 的大家,逐渐在各路专家、大 V、营销号对 AI 的热捧中感觉有点晕乎。
" 这 AI 好像还真挺厉害啊 "" 让我随便写几千字的论文可做不到啊 "" 让我随便画张宫崎骏我也不行 "" 咱们怕不是真要被 AI 取代了吧 " ——这类褒奖 AI,进而对未来产生迷惘的言论开始激增。
从最初的调侃,到某个时间点真的动了心思。我们似乎开始认真思考是否 AI 觉醒会给接下来的生活工作带来冲击。学习是不是没用了?工作是不是不好找了?是不是真的要在社交媒体上发一句 "AI 大神我是自己人,将来在人类监狱里给我留个好位置 "?
既然大伙有点急,那就先别急。在愚人节这个春风拂面的日子里,我们不妨给自己来点安慰剂,一起看看那些依旧蠢到爆炸,但依旧占据主流市场的 AI 技术。
看完之后你会发现,AI 那么蠢,到底怕它个啥?
DeepSeek 爆火之后,大家很快就发现它有个最大的问题,就是这幻觉也忒严重了。根据 Vectara 发布的大模型幻觉排行榜,DeepSeek-R1 的幻觉率达到了 14.3%,在主流大模型里已经属于非常高的水平了。
高幻觉率带来的体验感受,就是我们经常会发现 DeepSeek 给出的各种信息都是它瞎编的。推荐的店铺是不存在的,给出的文献是 AI 捏造的,提出的专业观点是信口胡诌的,最可气的是大模型编的还有鼻子有眼的。编造的历史文献居然还有朝代、有作者,上下文的文言文也没问题,简直防不胜防。
事情发展到这里,我们可能还主要是感叹 AI 挺厉害,不仅知道得多,骗人也这么有水平。但如果换个角度想想,我们就会发现大语言模型其实非常蠢:它胡编乱造的这些信息,都是从哪来的呢?
答案是,AI 绝大部分时间都是被人类忽悠瘸的。
大语言模型为了保证信息的时效性,在今天一般都会加入联网搜索机制。即让 AI 来进行信息检索,再将检索到的信息整理给用户。这里的问题在于,AI 检索到的信息都是互联网公开内容,换言之就是每个人都能随便写,营销号可以随便发的内容。这样一来,问 AI 和直接看这些虚假信息就没区别了,只不过加一道 AI 滤镜,很多人反而就信了。
我们可以注意一下大模型进行联网检索时提供的参考联接,其中大部分都不来自权威平台、权威作者,缺乏信源支撑。
更要命的是,想要用信息污染大模型在今天是非常容易的,只要换两个平台发布两个观点近似,但标题不一的文稿,大模型很容易采信你刚刚瞎编的说法。
更进一步的玩法是,可以用大模型生成虚假内容,发布之后再污染其他大模型。用大模型生成内容作为证据,再去发布更多内容。周而复始,虚假信息可以在自媒体平台与大模型幻觉之间形成一个莫比乌斯环,让辟谣的人跑断腿也解不开。
大语言模型特别好骗这件事,已经变成了一个急待修补的漏洞,开始被不法分子钻营。最关键的是污染 AI 这个办法,还特别容易骗到年轻人。很多年轻人一边反感长辈被微信群里的养生信息忽悠,一边问跟大模型求医问药。
咱们呐,是谁也别想好。
前几天我买了一台某品牌今年最新型号的扫地机器人。家电嘛,到 2025 年了没有不加 AI 的。这台扫地机主打的也当然是 AI 能力,尤其是依靠机器视觉来进行路线规划和避障。
然而就在它上岗的第一天,问题还是发生了。它工作一阵之后,我突然发现它在客厅门口无尽徘徊,既不工作,也不回去充电清洗,更没被东西缠住。打开 APP 之后才发现,它是把客厅门槛地垫上的图案识别成了线团。怕被缠住所以不能前进,但这种情况也没有绕过或者其他选项。它只能可怜巴巴地在地垫身边徘徊,徘徊,徘徊,一直徘徊了俩小时,没电了。
这种愚蠢的现象,其实普遍发生于今天所有机器视觉类的 AI 技术里。
机器视觉的一大 " 原罪 ",在于它的基本实现路径是模糊比对。即对比两种物体有多少相似的视觉信息点,如果达到一定比率就对比成功。
但问题在于,AI 会把真猫和画出来的猫当作同一种东西。于是地板上有个图案,机器人也会停步不前。同时,还可能把路标和加了一些像素点的路标当作截然不同的两种东西。前方有限速标识,但只要在标识上加一点干扰自动驾驶汽车就会猛冲过去,这就是对机器视觉的对抗生成攻击法。
缺乏 3D 视觉能力,特别容易被干扰,以及误判率过大等问题,让机器视觉常年处在看啥都是幻觉的乱吃菌子状态。
购买 AI 产品,或者企业引入 AI 能力时一定要想清楚:AI 的视力可跟你的视力不一样。
早几年,语音助手有个饱受诟病的问题,就是难以识别方言。怎么着,中国这么大,我想用个数码设备还得先练好普通话?字正腔圆播音腔跟你一个 AI 聊天?想什么呢?
于是乎,这几年智能语音方案的供应商快马加鞭,终于基本实现了方言识别的问题,今天已经很难找到只支持普通话识别的语音助手。
但是问题真解决了吗?并没有。如果我们留心一下,就会发现方言识别这个 AI 能力普遍存在一个巨大的问题,就是它需要慢速,且清晰地讲出方言,才能完成互動。
那么来自五湖四海的小伙伴可以回想一下了,我们大部分人的家乡方言,语速比普通话快还是慢?真的会像普通话教育里要求的一样咬字清晰,四声分明吗?
平时对着电视、手机、音箱讲话可能还好,但在车载场景、家务场景、运动场景里,要求慢速清晰讲方言简直就是个悖论。于是我们能看到全国各地怒怼导航,怒骂语音助手的群体狂欢。
有时候真不怪大哥大姐脾气暴。当你第十次对一台设备说出需求,然而换来还是那句:对不起,我没有听清,请您再说一次。小 X 很高兴为您服务。
这时你可能只想说一句:握是嫩蝶。
除了人类之外,你的家里还有多少会说话的东西?
十年前这句话可能是想讲个鬼故事,但现在大家可能真的已经算不清楚了。电视、手机、音箱、扫地机会说话还则罢了。冰箱、洗衣机、电饭煲、马桶会说话到底是为了什么?为了给家里制造一点活泼紧张,略显灵异的氛围吗?
原本这种情况已经够离谱了,今年开始更是离离原上谱。大模型爆火之后,所有白家电、黑家电、小家电都想给自己加大模型,反正开源的不要钱,还能蹭个热度。但最后的结果是,冰箱、洗衣机、洗碗机、抽湿机,都想跟你山南海北地聊上一顿,跟你输出个几百字上千字的内容感悟。家里住了十几二十位小 X,XX,XY 已经很烦躁了,这些位都化身话痨了可真是攒劲得很。
更愚蠢的是,这些智能家电每人的名字还都不一样。小这个小那个,感觉在办公室记人名都没这么麻烦。
而整件事最愚蠢的事情在于,语音唤醒这事的精度确实不高,经常想要叫洗碗机,电视答应了。更可怕的是家电们有时候会相互唤醒,一个不留神它们自己聊上了。
请设想这样一幕:深更半夜,睡到迷糊的你突然饿了,起身去厨房找吃的。黑灯瞎火的时候,背后突然一个声音说 " 抱歉,我没有听清 "。然后紧接着另一个角落里说," 已为您打开某某 APP",接着是冰冷的女声七嘴八舌响成一团……
啊,年年都说是 AI 元年,而我只听到蛙声一片。
说了这么多,是为了唱衰 AI 吗?完全不是,我是一个坚定的技术乐观主义者。并且 AI 连年的进步,应该早就证明了这条技术路线的价值与前景。
我只是试图展示这样一个客观现象:AI 只是技术工具的一种,它不会过分聪明,也不会过分愚蠢。它不是人工智障,也不是机械降神。
如果抛除掉我们腦海中对科幻文化里 AI 觉醒、机械生命这类概念的记忆,只把 AI 当作内燃机、数控机床一类的技术名词。或许会发现关于 AI 的种种魅影都烟消云散。然后我们可能会更坦然接受它的优点和缺点,享受它的每一次进步。
相信不久之后,以上所说的问题都会解决,但依旧会有更多问题留下。AI 就像任何技术一样,必须一步步在 " 问题 " 与 " 解决问题 " 中完成进化。是人类推动 AI 走向更好,同时 AI 作为工具也让人类获得更高的效率,更便捷的生活,仅此而已。
如果办个愚 AI 节,能消解我们对技术的恐慌,那不妨就办一个吧。希望你所有对 AI 的担忧与迷惘,都能在这个春天里烟消云散。
最后我想说一句:" 尚且盲目痴愚的 AI 之神啊,请原谅我今天的所有冒犯吧。"