今天小編分享的科學經驗:愚人節特輯:AI比你想象得更蠢,歡迎閲讀。
前幾年提到人工智能,網上的主流説法是管它叫 " 人工智障 "。但這兩年,随着大模型技術的突飛猛進,各類 AIGC 能力層出不窮。曾經輕視 AI 的大家,逐漸在各路專家、大 V、營銷号對 AI 的熱捧中感覺有點暈乎。
" 這 AI 好像還真挺厲害啊 "" 讓我随便寫幾千字的論文可做不到啊 "" 讓我随便畫張宮崎駿我也不行 "" 咱們怕不是真要被 AI 取代了吧 " ——這類褒獎 AI,進而對未來產生迷惘的言論開始激增。
從最初的調侃,到某個時間點真的動了心思。我們似乎開始認真思考是否 AI 覺醒會給接下來的生活工作帶來衝擊。學習是不是沒用了?工作是不是不好找了?是不是真的要在社交媒體上發一句 "AI 大神我是自己人,将來在人類監獄裏給我留個好位置 "?
既然大夥有點急,那就先别急。在愚人節這個春風拂面的日子裏,我們不妨給自己來點安慰劑,一起看看那些依舊蠢到爆炸,但依舊占據主流市場的 AI 技術。
看完之後你會發現,AI 那麼蠢,到底怕它個啥?
DeepSeek 爆火之後,大家很快就發現它有個最大的問題,就是這幻覺也忒嚴重了。根據 Vectara 發布的大模型幻覺排行榜,DeepSeek-R1 的幻覺率達到了 14.3%,在主流大模型裏已經屬于非常高的水平了。
高幻覺率帶來的體驗感受,就是我們經常會發現 DeepSeek 給出的各種信息都是它瞎編的。推薦的店鋪是不存在的,給出的文獻是 AI 捏造的,提出的專業觀點是信口胡謅的,最可氣的是大模型編的還有鼻子有眼的。編造的歷史文獻居然還有朝代、有作者,上下文的文言文也沒問題,簡直防不勝防。
事情發展到這裏,我們可能還主要是感嘆 AI 挺厲害,不僅知道得多,騙人也這麼有水平。但如果換個角度想想,我們就會發現大語言模型其實非常蠢:它胡編亂造的這些信息,都是從哪來的呢?
答案是,AI 絕大部分時間都是被人類忽悠瘸的。
大語言模型為了保證信息的時效性,在今天一般都會加入聯網搜索機制。即讓 AI 來進行信息檢索,再将檢索到的信息整理給用户。這裏的問題在于,AI 檢索到的信息都是互聯網公開内容,換言之就是每個人都能随便寫,營銷号可以随便發的内容。這樣一來,問 AI 和直接看這些虛假信息就沒區别了,只不過加一道 AI 濾鏡,很多人反而就信了。
我們可以注意一下大模型進行聯網檢索時提供的參考聯接,其中大部分都不來自權威平台、權威作者,缺乏信源支撐。
更要命的是,想要用信息污染大模型在今天是非常容易的,只要換兩個平台發布兩個觀點近似,但标題不一的文稿,大模型很容易采信你剛剛瞎編的説法。
更進一步的玩法是,可以用大模型生成虛假内容,發布之後再污染其他大模型。用大模型生成内容作為證據,再去發布更多内容。周而復始,虛假信息可以在自媒體平台與大模型幻覺之間形成一個莫比烏斯環,讓辟謠的人跑斷腿也解不開。
大語言模型特别好騙這件事,已經變成了一個急待修補的漏洞,開始被不法分子鑽營。最關鍵的是污染 AI 這個辦法,還特别容易騙到年輕人。很多年輕人一邊反感長輩被微信群裏的養生信息忽悠,一邊問跟大模型求醫問藥。
咱們呐,是誰也别想好。
前幾天我買了一台某品牌今年最新型号的掃地機器人。家電嘛,到 2025 年了沒有不加 AI 的。這台掃地機主打的也當然是 AI 能力,尤其是依靠機器視覺來進行路線規劃和避障。
然而就在它上崗的第一天,問題還是發生了。它工作一陣之後,我突然發現它在客廳門口無盡徘徊,既不工作,也不回去充電清洗,更沒被東西纏住。打開 APP 之後才發現,它是把客廳門檻地墊上的圖案識别成了線團。怕被纏住所以不能前進,但這種情況也沒有繞過或者其他選項。它只能可憐巴巴地在地墊身邊徘徊,徘徊,徘徊,一直徘徊了倆小時,沒電了。
這種愚蠢的現象,其實普遍發生于今天所有機器視覺類的 AI 技術裏。
機器視覺的一大 " 原罪 ",在于它的基本實現路徑是模糊比對。即對比兩種物體有多少相似的視覺信息點,如果達到一定比率就對比成功。
但問題在于,AI 會把真貓和畫出來的貓當作同一種東西。于是地板上有個圖案,機器人也會停步不前。同時,還可能把路标和加了一些像素點的路标當作截然不同的兩種東西。前方有限速标識,但只要在标識上加一點幹擾自動駕駛汽車就會猛衝過去,這就是對機器視覺的對抗生成攻擊法。
缺乏 3D 視覺能力,特别容易被幹擾,以及誤判率過大等問題,讓機器視覺常年處在看啥都是幻覺的亂吃菌子狀态。
購買 AI 產品,或者企業引入 AI 能力時一定要想清楚:AI 的視力可跟你的視力不一樣。
早幾年,語音助手有個飽受诟病的問題,就是難以識别方言。怎麼着,中國這麼大,我想用個數碼設備還得先練好普通話?字正腔圓播音腔跟你一個 AI 聊天?想什麼呢?
于是乎,這幾年智能語音方案的供應商快馬加鞭,終于基本實現了方言識别的問題,今天已經很難找到只支持普通話識别的語音助手。
但是問題真解決了嗎?并沒有。如果我們留心一下,就會發現方言識别這個 AI 能力普遍存在一個巨大的問題,就是它需要慢速,且清晰地講出方言,才能完成互動。
那麼來自五湖四海的小夥伴可以回想一下了,我們大部分人的家鄉方言,語速比普通話快還是慢?真的會像普通話教育裏要求的一樣咬字清晰,四聲分明嗎?
平時對着電視、手機、音箱講話可能還好,但在車載場景、家務場景、運動場景裏,要求慢速清晰講方言簡直就是個悖論。于是我們能看到全國各地怒怼導航,怒罵語音助手的群體狂歡。
有時候真不怪大哥大姐脾氣暴。當你第十次對一台設備説出需求,然而換來還是那句:對不起,我沒有聽清,請您再説一次。小 X 很高興為您服務。
這時你可能只想説一句:握是嫩蝶。
除了人類之外,你的家裏還有多少會説話的東西?
十年前這句話可能是想講個鬼故事,但現在大家可能真的已經算不清楚了。電視、手機、音箱、掃地機會説話還則罷了。冰箱、洗衣機、電飯煲、馬桶會説話到底是為了什麼?為了給家裏制造一點活潑緊張,略顯靈異的氛圍嗎?
原本這種情況已經夠離譜了,今年開始更是離離原上譜。大模型爆火之後,所有白家電、黑家電、小家電都想給自己加大模型,反正開源的不要錢,還能蹭個熱度。但最後的結果是,冰箱、洗衣機、洗碗機、抽濕機,都想跟你山南海北地聊上一頓,跟你輸出個幾百字上千字的内容感悟。家裏住了十幾二十位小 X,XX,XY 已經很煩躁了,這些位都化身話痨了可真是攢勁得很。
更愚蠢的是,這些智能家電每人的名字還都不一樣。小這個小那個,感覺在辦公室記人名都沒這麼麻煩。
而整件事最愚蠢的事情在于,語音喚醒這事的精度确實不高,經常想要叫洗碗機,電視答應了。更可怕的是家電們有時候會相互喚醒,一個不留神它們自己聊上了。
請設想這樣一幕:深更半夜,睡到迷糊的你突然餓了,起身去廚房找吃的。黑燈瞎火的時候,背後突然一個聲音説 " 抱歉,我沒有聽清 "。然後緊接着另一個角落裏説," 已為您打開某某 APP",接着是冰冷的女聲七嘴八舌響成一團……
啊,年年都説是 AI 元年,而我只聽到蛙聲一片。
説了這麼多,是為了唱衰 AI 嗎?完全不是,我是一個堅定的技術樂觀主義者。并且 AI 連年的進步,應該早就證明了這條技術路線的價值與前景。
我只是試圖展示這樣一個客觀現象:AI 只是技術工具的一種,它不會過分聰明,也不會過分愚蠢。它不是人工智障,也不是機械降神。
如果抛除掉我們腦海中對科幻文化裏 AI 覺醒、機械生命這類概念的記憶,只把 AI 當作内燃機、數控機床一類的技術名詞。或許會發現關于 AI 的種種魅影都煙消雲散。然後我們可能會更坦然接受它的優點和缺點,享受它的每一次進步。
相信不久之後,以上所説的問題都會解決,但依舊會有更多問題留下。AI 就像任何技術一樣,必須一步步在 " 問題 " 與 " 解決問題 " 中完成進化。是人類推動 AI 走向更好,同時 AI 作為工具也讓人類獲得更高的效率,更便捷的生活,僅此而已。
如果辦個愚 AI 節,能消解我們對技術的恐慌,那不妨就辦一個吧。希望你所有對 AI 的擔憂與迷惘,都能在這個春天裏煙消雲散。
最後我想説一句:" 尚且盲目痴愚的 AI 之神啊,請原諒我今天的所有冒犯吧。"