今天小編分享的教育經驗:第四範式聯合創始人胡時偉:AI為什麼沒有達到令人滿意的程度?,歡迎閱讀。
關于大模型和生成式 AI 他說的話令人振聾發聩:
" 大語言模型就是一千萬個猴子寫莎士比亞的作品。"
" 我們不應該期待大模型擁有湧現的能力。"
" 我是不是不用努力、讓大模型公司與聰明的 GPT 來解決我的問題就行了?這其實是一個偽命題。想要解決行業的問題,行業從業者必須腳踏實地、付出超常的努力。"
他就是第四範式的聯合創始人、首席架構師胡時偉。
第四範式是人工智能技術與服務的供應商,也是國内人工智能領網域的先行者。作為第四範式的聯合創始人與首席架構師,胡時偉在過往百度、貝殼與自己的創業經歷中看到了 AI 助力企業數字化轉型并真正帶來質變的潛力,由此立志為下一代企業提供突破關鍵瓶頸、夯實競争壁壘的解決方案。
大模型時代催生了怎麼樣的商業模式?面對來勢洶洶的 AI,企業主與創業者需要規避怎樣的認知誤區?企業應該如何架構自身的數字化能力,并最終為行業帶來革命性的變化?
混沌在上海滴水湖洲際酒店舉辦 " 一 " 思維創新嘉年華活動。用一整座島、打造兩天兩夜的共學場,2000 位混沌同學熱烈參與其中!邀請 AI 全明星陣容空降授課。
此次,胡時偉做客混沌 " 一 " 思維創新嘉年華,帶來的分享是《AI 為企業核心競争力帶來的變革性影響》。本文為混沌 " 一 " 思維創新嘉年華大課筆記第七篇。
授課老師丨胡時偉 第四範式聯合創始人,首席架構師
編輯丨混沌商業研究團隊
支持丨混沌前沿課
我關心的是 AI 讓行業產生質變了嗎?
首先,我想讨論技術與商業的關系問題。目前,大部分企業都在強調 " 降本增效 "。問題在于,降本增效的作用是什麼?換句話說,如果 AI 技術能夠幫助企業降本增效,大家會覺得是一件再自然不過的事情。但是,AI 走到今天為什麼還沒有達到令人滿意的程度?關鍵在于,降本增效能否對產業形成真正的衝擊力?有多少企業發生了質的變化?其中的标杆性企業又發生了多大的變化?
以移動互聯網為例,最開始它只起到生產力直接替代的作用。最早,電腦能做什麼,手機就能做什麼,比如手機上的浏覽器、音樂播放器、小遊戲等各種應用,用戶可以在移動端做着 PC 端的事情到處跑。
而互聯網的真正爆發是在滴滴打車、美團外賣、抖音短視頻的應用出現後,因為它們是在新的生產力之上疊加了生產關系的進化,實現了產業模式替代。
大模型時代也是同樣的道理。目前,我們仍然處于初期階段,原先由人做的事情,現在大模型也能做了,原先只有人能聊天,現在大模型也能聊天了,這就是早期的生產力替代。
但是,大模型時代究竟有怎樣的新模式?其中會不會產生像滴滴打車之于出租車的變化?想必這也是各位創業者與從業者十分關心的問題。
實際上,大部分大模型項目目前仍處于混沌期,它具有一定的使用價值,但從根本的角度到底解決什麼樣的模式問題,其實還沒有得到解答。在大模型時代的某一階段,商業模式會變得特别重要。在我看來,這個問題至少可以沿着以下五條思路展開:
第一,新技術能夠在什麼場景下解決哪些客戶的何種需求。任何一項新技術在走向生活與生產的過程中都必須變成一個產品或者以何種方式滿足客戶的需求,難以做到這一點的大模型可以被淘汰出局。
第二,新技術到底搶了誰的蛋糕,或者是否真正創造了新的蛋糕、是否對產業形成結構性的影響。
第三,如何确定成本結構與ROI。有時候,盡管新技術帶來了效率提升,但我們同時需要回答一個問題:為了獲得這些好處,我們付出了多少成本代價。比如有企業做營銷模型,花費四五百萬買伺服器、招團隊,最後只盈利了三十萬,這樣的情況比比皆是。
第四,企業是否具備足夠的資源能力,來以產業協作的模式落地。
第五,企業能否建立起足夠的競争壁壘。首先,面對新技術企業需要主動出擊,否則将會面臨被淘汰的風險。然而,主動出擊僅僅能夠保證我們不會輸在起跑線上,究竟誰用新的技術產生了革命性的變化,還是要看模式的競争壁壘夠不夠深。
就我個人的過往經歷而言,百度與貝殼找房的共同特點,無不是回答了上面的五個問題,疊加數字化或者人工智能、機器學習的技術,最終為行業帶來了質的變化。
百度為廣告行業帶來的最大變化,是打破了廣告的搜索與分發規則。從原先廣告賣的是關鍵詞與一整個版面,到開拓了單人單次刷新的單獨售賣模式。這具有颠覆性的創新,AI 在其中發揮了重要作用,它可以幫助廣告做關鍵詞推薦、為每一次刷新進行動态計算。
而對于產業互聯網而言,運營模式十分重要。以貝殼找房為例,大家對貝殼找房的普遍印象,是它的 ACN 與行業運作标準化。
我想從另一個角度描述這個問題。在貝殼找房之前,中國中介行業的規模不超過四萬,而貝殼的平台可以達五十萬人。實際上,這不完全是由行業标準化 ACN 導致的。貝殼旗下經紀人的平均年齡、平均從業時間、平均培養周期,與其他中介公司之間存在數量級的差距。同時,為了把行業的集中度提升十倍,我們致力于降低從業者的方差,讓系統與人配合,使得更多員工在平台上進行有序的工作。
就此而言,下一代企業如果想要擁有碾壓競争對手的核心競争力、以遠超行業水平的擴張能力與利潤水平在市場競争中獲勝,必須要具備無法輕易復制的競争壁壘、量變到質變的運營水平,以及在某些產業關鍵要素上比别人好十倍,由此帶來一個關鍵資源瓶頸解鎖後的指數級擴張能力。
關于大模型和生成式 AI 的 5 個認知誤區
第二部分我想讨論 AI 和技術的原理。AI 這件事起起伏伏,而我們正處于 " 起 " 的階段。但是,比起 " 起 " 的階段,我們更應該關注中間的沉寂周期。一項技術之所以在爆火之後引起質疑或銷聲匿迹,是因為它無法滿足大眾對于 "技術應該為生產生活帶來巨大的改變" 的預期,而往往在沉寂期之内是技術冷靜下來真正帶來價值產生沉澱的部分。
在這種起伏的浪潮之中,我們同樣可以看到兩種趨勢。第一,是 "一浪高過一浪", 我認為 AI 總體上在產業的價值一定會越來越大,按照 VC 維的理論,随着數據越來越多,規則數越來越多,機器創造的價值一定會越來越大。第二,是每個波峰之間的距離在逐漸縮短,原來是二三十年,現在是十年、幾年、甚至幾個月,AI 就會迎來重大的技術突破。
技術圈看 AI 發展,真正有突破性成功的有 4 個階段。第一個階段是人類專家寫少量的規則,再輸入給計算機;第二是機器利用數據寫少量的規則,出現一些簡單的模型;第三是機器用海量的數據寫大量的規則,這其實就是深度學習,或者叫專用大模型;第四次就是我們現在講的通用大模型,用海量的數據,在一個大的計算代價下能解決若幹個問題,比如問答、總結、擴寫。
前兩次突破應用的場景非常有限,後兩次突破在生產生活中有非常大的作用。比如在專用大模型的時代,我們可以享受到高維、實時、閉環技術帶來的代際優勢,前面提到的百度與貝殼颠覆了業态,也有推薦算法、人臉識别這類嵌入生活的技術應用。當然也會有比較失敗的案例,比如企業盲目做數據中台、AI 中台,大部分都是失敗的。最後留下來的都是技術、商業模式和產業發展的結合。
而在通用大模型的時代,我想首先抛出幾個有關通用大模型和生成式 AI 的認知誤區:
第一個誤區,是模型具備一定的推理能力。情況并非如此,至少GPT 類的模型只會續寫,沒有任何的意識或認知成分。我們可以以推理為目标來做一個專用大模型,或者通過通用大模型在遷移學習上增加新的任務。但是,從實質上講,大語言模型是通過随機生成預測多個序列,通俗地說,大語言模型就是一千萬個猴子寫莎士比亞的作品。
第二個誤區,是模型具備湧現能力。随着參數的增大,AI 确實可以解決很多問題。但是,所有的湧現都是因為 AI 具備了相應的數據與信息,或者是有對應的任務來對 AI 進行方向性的引導。我們需要用任務的方式,把 GPT 模型的續寫能力從語料中引導出來,實質上這仍然是機器學習的架構。我們不應該期待大模型擁有湧現的能力。
第三個誤區,是模型可以自動學習、自主進步。至少從目前我們所擁有的工程化能力來講,有多少 " 人工 " 就有多少 " 智能 ",AI 仍然是一個 " 高級復讀機 "。就算我們把行業中所有的培訓資料都喂給大模型,它也不一定能夠正确回答我們的某些問題。反而我們需要付出很大的力氣,對所有的信息加以人工标注和處理,如此 AI 體現出來的智能能力也就越好。
第四個誤區,是模型可以通過調優達到不犯錯誤的狀态。由于 GPT 是随機性的生成,有時它會 " 一本正經地胡說八道 ",這是由技術底層原理決定的,通過調優也難以解決。因此,面對生成式 AI 在可靠性、可解釋性上的問題,我們要尊重這種不确定性,并通過系統化的工程建設,比如人的運營與反饋,來完成大模型落地的最後一公裡。
第五個誤區,是模型可以替代人類的工作,從而造成大量的失業。對于這件事,我們其實不必過分焦慮。如果想讓一個模型去替代一個崗位,需要付出的努力與代價肯定會比這個崗位本身大得多。另一方面,AI 本身也意味着全新的商業機遇,局部的失業與部分企業的被淘汰是可能發生的,但與其杞人憂天,我們不如積極推動這件事。推動之後,機會就能夠掌握在我們自己手上。
大模型不是捷徑。從企業的角度來講,以上五個誤區會導向一種錯誤的認知,原先一個企業花費了很多年的時間來解決行業上的問題,如今有了大模型公司之後,這個企業反而會自問:我是不是不用努力、讓大模型公司與聰明的 GPT 來解決我的問題就行了?這其實是一個偽命題。想要解決行業的問題,行業自身的從業者必須付出超常的努力。否則,就算能夠讓大模型去改造别人,我們也享受不了 AI 的紅利。
5 步提升企業的數字化能力
最後,我想讨論企業的數字化能力架構。如果企業有志于為行業帶來革命性的變化,應該如何落實行動?
企業經營者在新技術面前,有時會擔憂自己跟不上,為了追求快速落地、從追求價值的質變變成場景的生搬硬套,有時會太過依賴解決方案的公司,寄希望找到最佳實踐走捷徑。當前國内大部分企業已經走到了行業的深水區,需要有原創式的創新能力。我通常會建議企業從戰略、策略、執行、技術、安全這五大層面進行思考,全面架構自身的數字化能力。
戰 略
戰略的問題是行業的問題,即如何找到行業最核心的競争要素、如何突破限制行業的關鍵瓶頸、如何找到突破關鍵瓶頸的競争優勢。
中國的企業當下往往面臨幾種困境。首先是產業鏈定位的困境,在微笑曲線當中,高價值鏈集中在曲線的兩端:一端是定義,另一端是真正的服務。而大量的中國企業尚處在中間比較低級的原材料和組裝生產制造的價值鏈上,未具備定義產業鏈的能力,只是去卷初級價值鏈。
其次,互聯網、物流的發展讓企業也受到了更全網域競争的威脅。以往區網域間文化屬性與市場洞察的差别導致難以形成全國性的單一市場,像是以前的鏈家難以走出北京。這方面正在被新技術所改變,不同城市的細節策略可以通過 AI 服務規模化來覆蓋,全網域競争的企業開始大量出現。
最後,受到企業路徑依賴的限制,中國的企業也面臨着組織僵化的困境。以企業的人才培養為例,大量的企業通過實踐來培養人才。當這些人才成為領導,他們就會按照過去的方式去指揮未來的戰鬥,這就是僵化為企業帶來的問題。
那麼,數字化如何才能打破多重困境?從戰略的角度,我們要重新審視企業的核心要素以及要素替代的可能性。
第一,我們應該關注當前和未來一段時間内企業的核心資產和關鍵要素是什麼。
第二,解構關鍵要素所遇到的瓶頸與限制是什麼。我們經常提到 " 不可能三角形 ",它指的是成本、質量與規模之間的關系。企業經營者要找到這個 " 不可能三角形 " 的關鍵瓶頸點。
第三,在關鍵瓶頸上用數字化形成革命性的變化,将使我們獲得巨大競争優勢。各行各業的關鍵要素,比如連鎖行業的店長,房產經紀行業的經紀人,在發展擴張的過程中就會面臨優質資源缺失的問題。如何能夠解構這種稀缺?用數字化替代和賦能。原來口腔門診的核心資源瓶頸是院長,現在我們把院長的客戶經營、财務經營、治療等三個關鍵能力解構成不同的要素,并且進行了不同程度上的要素替代。
第四,為了知道數字化替代是否合理,對戰略是否產生正向影響,我們還要進入數字化實驗的階段。
我們并不一定要在每個地方都做到數字化,去尋求降本增效的提升,但是在你的關鍵資源上,數字化形成革命性的變化,由此就能降低關鍵資源的稀缺度,帶來更高效的集約擴張,讓你赢得競争的關鍵。
策 略
戰略指導企業數字化朝哪走了,策略的重要性在于,要在哪些地方做出正确的決策、怎麼讓策略的成功率盡可能變高、以及如何讓決策不停地迭代更新。
想要在更細顆粒度的層面做好決策,我們必須提升模型的維度與策略的復雜性。從一刀切到形成充分的個性化,包括商品匹配的個性化與服務策略的個性化。
怎麼做到個性化?關鍵在于把不同的事情進行分類,分類之後再匹配不同的策略。類别越細、在關鍵業務環節的效率就越高。百度、字節千人千面的成功證明維度的指數級提升,的确能夠帶來極致的業務效果,策略復雜度的重要性即在于此。
在這一過程中,我們必須借助決策類 AI,把人的決策與機器決策結合起來。我們還要關注決策的執行是否有效,構建一個實時迭代的閉環反饋的系統。實際上,四年前我在混沌課上就讨論過這個問題,但是在四年之後,用 AI 驅動的企業仍然寥寥無幾。
為什麼沒有出現大量的用 AI 驅動的企業,這是因為我們沒有數據。為什麼我們沒有數據,因為我們大部分企業再做再多的信息化、數字化,最多只能解決企業 5% 的問題,剩餘 95% 的過程類數據仍然難以獲得。現實世界與虛拟數字世界之間的鴻溝是巨大的。
執 行
從執行層面來講,主要是通過生成式 AI 解決策略被高效執行的問題。AIGC 時代,企業的所有軟體都可以重做一遍,把軟體構建在多模态對話框的基礎上。AIGC 時代的機會,它為企業的軟體和數字化所帶來的提升,主要體現在兩個方面:
第一,從使用者的體驗來講,AIGC 可以帶來體驗跨越式的提升。比如在醫療健康的 2B 領網域,AI 可以幫助老醫生操作電腦,從而大大提升醫生的工作效率。
第二,AIGC 可以帶來軟體開發效率的巨幅提升。數字化最令人頭疼的問題是業務與程式員之間、業務思維與實踐之間的鴻溝,兩者之間還隔着產品經理與界面設計師,由此導致了 " 買家秀 " 與 " 賣家秀 " 之間的差距。AIGC 出現一段時間後将沒有反人性的互動,簡單來說,我們可以跨越鴻溝、直接給 AI 下達指令,我們怎麼說,它就怎麼做。
生成式 AI 在企業系統領網域的發展将會經歷三個階段。在 1.0 階段,AI 能夠聽從我們的指揮做事。在 2.0 階段,我們可以讓 AI 的 agent 互相協作,或者由人和 AI 通過自然語言的形式進行協作。3.0 階段解決的是關鍵要素的解構問題:AI 的 agent 如何替代一部分人力要素,人和 AI 的 agent 怎麼通過迭代的方式生成策略。因此,我們就形成了執行過程與企業大腦策略制定過程的閉環。在這個過程中,企業避免了僵化與局網域競争,前者得益于機器決策,後者得益于數據驅動下的千店千策,由此導向產業鏈的重新定義與產業的重塑。
還是以牙科創業為例,如果要讓一個院長既懂牙科治療、又懂客戶經營、還願意創業和管理,這無疑是非常困難的。我們可以把牙科診所的行為解構為眾多 agent 和人之間的整套系統,依托這種思維,牙科創業會變得相對簡單。
技 術
技術上我們怎麼構建企業的數字化團隊?首先,大的原則是從建設很多系統變成構建很多 agent。同時,評價系統的方式也要從評價功能變成評價 agent 在業務當中的價值。培訓一個系統的過程,也要從原先的業務功能需求變成培訓 agent。總體來講,整個軟體行業會發生變化:從構建系統變成構建 agent 的網絡。這些agent從一開始的被動調取,進而進化到輔助人的決策,再到主動參與協作,甚至變成一個協調者。
其次,企業不能止步于把系統構建起來,而是要向着核心戰略目标不停提升。企業要建立分工有序、向優迭代的人機協同的管理體系。
安 全
在大模型時代,尤其要關注安全能力。具體而言,首先需要關注數據安全,例如我們需要關注公有雲產品的安全認證,避免數據的無意洩漏。
其次是應用安全。大模型時代也有注入,我們甚至可能在 ChatBI 中問出經理的工資。
另外是業務安全。如今,越來越多 AI 在進行閉環的自動反饋和自動學習,如果有人進行模型投毒、惡意喂給它偏向性的樣本,我們将很難剔除劣質數據的影響。
最後是生產要素安全。以前,就算代碼被偷走也很難引起什麼風波,因為别人不知道企業内部是怎麼運轉的。如今,一旦系統連帶着大模型數據被偷走,由系統管理的 agent 與業務也會一并洩露,這将會造成非常大的影響。
Q&A
張曉楠:您剛才提到,結果數據只能解決企業 5% 的問題,剩餘的 95% 要依靠過程數據,未來 AI 能夠在過程中很好地賦能。能否請您詳細論述這一觀點。
胡時偉:舉個簡單的例子,假設每一個講師都有自己的 agent,聽眾首先不是向講師本人、而是向 agent 提問。在這個過程中,我們就知曉了聽眾的關注重點、他們在什麼地方產生了什麼聯想。這其實就是一個收集過程數據的方式。按照我們以前的想法,我們得請四百個助教來回答問題,如今這四百個助教可以變成 AIGC。其中有很多種建構方式。
張曉楠:目前第四範式在部署什麼產品以更好地服務客戶,有哪些代表性的場景或案例?
胡時偉:首先,我們會跟產業進行深入的交流。假設我們用到釘釘、企業微信,基本上我們能夠得到一個形态、一個員工與企業系統進行互動的接口,這個接口裡面可能有一些基礎的大模型能力。
但是,這些能力究竟能夠在企業的業務中發揮什麼具體作用、能夠應用到什麼場景當中?企業的核心競争要素應該怎麼拆解、應該怎麼去構建對應的應用?針對這些問題,第四範式致力于為企業提供從标準化產品到上層戰略的解決方案。
另外,不同的 agent 其實對應着不同的能力,每個行業也存在各自的問題。因此,除了商用的通用大模型之外,企業還得構建自己的大模型。第四範式也為此提供對應的解決方案。