今天小編分享的互聯網經驗:大模型再發展5年,搜索引擎還在麼?,歡迎閲讀。
圖片來源 @視覺中國
文|李智勇
大模型既是内容的生成器也是信息的過濾器,而搜索只是信息的過濾器,那發展下去搜索引擎這個自互聯網發生以來就存在的產品會受到什麼影響?
被動搖的搜索根基
想象一個中期場景:假如一半以上的内容是人工智能體在生產和消費,那搜索引擎會怎麼樣?
原始意義的搜索引擎會消失,名實具亡。
因為搜索最基礎的機制會被動搖,并逐漸失效。
搜索引擎從產品上看并不復雜,就是要在海量信息中快速找到你需要信息的工具。而判斷是不是你需要的信息就在于 PageRank 等算法,這些算法依賴鏈接數和質量等判斷内容的權重,再依賴關鍵字來判斷匹配度。
現在這兩點正好都會出問題。
鏈接可能不是真的鏈接,而關鍵字對應的内容可能是人工智能生成的内容。人工智能生成的内容增長速度一定遠大于人生成的内容,而這部分内容并沒譜,是帶着我們經常説的幻覺所生成的内容。假如互聯網上的内容一共是十,如果這部分内容的比例超過五,那搜索要面對的就是概率在 50% 以上的一個虛拟世界反饋出的結果。不管你怎麼用算法來排序,也規避不了這種失真和不準的問題。可以想象一個極端情況,就是全網 50% 的内容都和一個人工智能生成的内容發生鏈接,那按照搜索的機制,無疑的這是應該被排到前面的,而則可能是不對的,它不一定質量很好,而只可能是被用其它模型生成内容用的多。
這進一步意味着信息精度的責任方在轉移,過去是搜索引擎負責從已有内容中盡可能過濾出有價值的信息,而如果這套機制失靈,那就變成大模型在信息生成的同時需要扮演信息質量保證者的角色。模型自身決定了信息的精度。
不局限于搜索引擎
這顯然不局限于搜索引擎,過去我們一共有兩種主要信息集散方法:
一種就是上面説的搜索引擎,一種則是在頭條和抖音上廣泛被應用的個性化推薦。
而如果大模型在内容源上占據統治性,超過 50%,那依賴于個性化推薦的產品同樣會受到衝擊。不過衝擊的表現形式會有所不同。
國内幾個個性化推薦平台,通常和 UGC 相關,這樣一來,首先衝擊的是内容生成端。
如果把大模型的内容生產水平畫一條線,那這條線以下的生產能力,沒有存在的基礎,會很快的被淹沒。而在這條線上面的除非有明确的标識度,比如你在社會上是個名人,否則也會被淹沒。
而如果是大模型對大模型(都基于大模型進行生產),那數據量則會飛漲。
内容膨脹之後,很可能流量分布上會兩個趨勢同時發生:一個是中心節點會有更大的增長量,一個則是一般的流量會被攤的更加稀薄,也就是上面説的一般人會更容易被淹沒。
像更加靠譜的中心節點集中是因為不知道别的信息是對是錯,只能借助于傳統的社會體系的篩選,一般的流量更加分散則是因為内容過多,流量還是那麼多,内容變多,那平均下來肯定更加稀薄。
這就會產生一個流量的鴻溝。
跨越流量鴻溝可能比現在更為困難,而在此之前拿到的流量可能會變的更加值錢。
與此同時,另一個附帶效果可能是 UGC 平台利潤空間會下降,因為信息的總價值并不會因為因為量的增加而增加,但它的處理成本卻會因此而上升。信息量增加後,不管存儲還是計算成本都會增加。
怎麼辦?
怎麼辦裏面最原點的選擇是不用(比如禁止大模型使用),但這顯然不靠譜。
不同的學校對此也采取過不同的态度,有的學校是完全禁絕大模型在做作業等環節的應用;有的學校則非常開放,全面接受。
但這事其實不難選擇,因為我們好像又回到了大禹和他爹的選擇
未來的現實是大模型會成為工作生活的底座和外殼,在它之上每個人都會變成現實版的鋼鐵俠。
你可以選擇不穿,那你力量就弱。既然如此,那顯然不能禁止,只能比誰用的更好,否則就和清朝禁海差不多。
關鍵是要在面對的同時處理它潛在的負向結果。
最典型辦法就是唯一性身份認證。唯一性身份認證能夠降低一部分純粹機器人的内容生產,但沒辦法避免每個内容生產者都變成超級英雄一樣超高速進行内容生產。
次一級的方法則是模型對模型。我們确實需要清楚的認識到因為信息的暴漲,最終只有模型才可能處理模型相關的事務。但即使把模型滲透到審核等環節,模型對模型也只能降低的太差的水貨,或者説明顯在認知錯誤。模型生產出來的真的質量上乘的作品是沒辦法的,也不應該被禁止。但不管結果如何,模型要肩負起信息生成和分發的責任是确定的。
從這個角度再遞進一步,到每個人具體的生活體驗,也會發生變化。因為信息的膨脹個人已經失去了自我篩選信息的能力(看報紙的時候基本是自我進行信息篩選),所以這時候助理會履行這個職責,别看過去的小愛同學等又呆又傻,但到後面它還是會變得越來越不可或缺。助理首先衝擊搜索,相當于在搜索上又套了個殼,推薦由于本質上相當于是助理在後台進行推送,影響還在搜索之後,比如個人助理怎麼和推薦進行互動一樣是需要解決的問題。
但影響還不止于此。
奇點曲線的新解
全面擁抱大模型等馬上就帶來一個新的後果。
我們都知道當年奇點臨近裏畫了一條指數曲線,但這條曲線的含義卻很少被進一步解讀。
當社會的變化和智能是指數型向上的時候,比如 GDP 增長,那意味着企業或者個人的事業必須是指數向上,否則就會被甩下來。道理很簡單,如果平均 GDP 增長是 10%,一個企業的增長則是 5%,那大概率它會破產,而一個人的收入增長如果是 5%,那很可能他會變的相對貧困。
而人的部分是不可能做出指數型增長的,所以能夠匹配高速增長且不掉落,就只可能是基于大模型等技術的組織和個人。這是一種碳基智能和硅基智能找到合适邊界的復合體。從這個角度看大模型确實也只能被擁抱,而不可能被規避。
回到我們文章題目的設問,從這個角度看,現在形态的搜索可能五年到十年後就真的不在了。因為當下搜索這種信息分發方式太不智能了,智能越翻倍,這種初級的信息分發方式就顯的越落後和不精準。
小結
在尋找智能飛輪:從數據枯竭到多模态再到自生成裏,我們提到過這樣一個觀點:企業裏的場景和任務,其實是在封閉和開放之間連續的,比如總是既有外賣小哥這類工作,也有 CEO 的工作,前者就封閉後者就開放。然後不同的企業裏不同類型的工作配比不一樣,比如工廠裏或者清潔公司就封閉度高,大學可能就開放度高。如果面向未來的話,那顯然要加一點,硅基的人工智能和碳基的人類所對應的整體智能配比也不同,這會變成未來組織的一個關鍵特征。