今天小編分享的科技經驗:周鴻祎:AI 是賦能者,而不是單純的颠覆者,歡迎閲讀。
頭圖來源:極客公園
兩年前,大模型剛興起時,周鴻祎開始用四個「你相不相信」呼籲現場建立 AI 信仰,從此踏上「AI 布道者」之路。
去年,作為國内第一批發布大模型的互聯網公司,360 的戰略調整為「All in AI」。今年,360 在 AI 領網域取得不少進展,1 月底上線 360 AI 搜索;7 月發布國内首款兒童 AI 手表 360 兒童手表 A9 AI 紅衣版;8 月宣布與國内 15 家大模型廠商達成合作,共同推出新一代 AI 產品「AI 助手」……
如今,大模型技術的出現,深入影響了各行各業的發展軌迹,成為不可忽視的重要力量。但在周鴻祎看來,大模型不應被神化,而是應該被視為一種賦能工具。
在極客公園 IF2025 創新大會上,360 集團創始人周鴻祎在「在大模型時代年輕人值得幹點什麼」的主題演講中談到,AI 的本質是「賦能」,而非單純的「颠覆」。在 AI 時代,AI 的作用是為各個行業提供賦能、重構遊戲規則,而不是單純打破現有的格局,AI 應該像電動機一樣嵌入到各種應用場景中,推動產業革命。
周鴻祎總結了他眼中關于未來的六個趨勢:
AGI(通用人工智能)和超級人工智能發展放緩;
大模型趨向專業化;
模型越做越小;
訓練數據質量提高;
成本降低;
InfraStructure 建設基本完善。
同時,他也列出了六大應用方向,希望年輕人能夠從大模型的六大應用方向中尋求到屬于自己的機會。
人人智能;
從萬物互聯走向萬物智能;
數轉智改,助力傳統產業打造新質生產力;
未來和新興產業;
打造科研新範式;
AI 安全。
如今,大模型正在把所有行業、把所有賽道都重寫一遍,時代的遊戲規則已改變,新的機會擺在了所有人面前。
以下為周鴻祎現場演講實錄,由極客公園整理。
周鴻祎:今天在講人工智能之前,先跟大家説説我為什麼拍短劇。我之前唯一看的一集短劇是《二十歲總裁愛上保潔阿姨》,看的時候有兩個周鴻祎,一個理性的周鴻祎一邊看一邊吐,能這麼拍?感性的周鴻祎説快點下一集。那麼我為什麼拍一部短劇呢?有些部門審核了之後説:我們發現你拍的不是短劇,完全是廣告片,所以我們拍短劇的目的是什麼,等下跟大家分享一下。
國内把這個事説得太神秘了,一説就是企業家做 IP,一説做 IP 在座很多人就覺得我又不是什麼著名人物,我有什麼 IP 可做的?
但其實説白了在短視頻和短劇時代,短視頻和短劇已經把我們頭腦格式化之後,過去傳統公關部和市場部或者用户增長部要幹的一件事就是要搞流量。
我前一段時間去硅谷,跟很多創業公司談,他們沒有什麼 IP 的概念,但是你問每個公司説如何冷啓動你的公司,如何冷啓動你的產品?答案都是一致的,就是做魔性的短視頻,在國外短視頻平台上獲取免費流量,這是我們拍短劇的目的。現在這個短劇也正在拍續集。
最近有一個概念叫 Founder Mode。在短視頻時代,傳播遊戲規則發生了改變,跟用户溝通方式發生了改變,更大的改變是在于大模型,它的出現改變了技術架構和商業模式。所以我現在是在帶領 360 二次或者三次創業。
我今天分享一下我對大模型發展的思考,關于在大模型時代年輕人值得幹點什麼。
許多互聯網行業的「老兵」可能會認為,AI 與互聯網的發展規律相似,甚至會產生一種絕望感,覺得互聯網已經經歷了二十年的發展,許多機會和格局已經初步成型。前幾天,馬雲在螞蟻集團的講話中提到的一個觀點我非常贊同——AI 是比互聯網更大的機會。因此,互聯網時代的規則和思維方式不一定适用于 AI 時代。如果我們在 AI 時代仍然沿用互聯網時代做 APP 或 Web 的思維來開發 AI,那就像刻舟求劍。
舉個簡單的例子,互聯網能否提升生產力?互聯網确實能夠提高溝通效率,但這并不是互聯網的本質。互聯網的核心在于連接——連接人與信息、連接人與人。
周鴻祎在極客公園 IF2025 創新大會|圖片來源:極客公園
互聯網完全跟現實世界無關,而是創造了一個虛拟的時空,在互聯網裏又產生了很多獨特的社交、社區模式。而人工智能的最大不同之處在于,它是一種直接提升生產力的工具,而且生產力更強。
硅谷的一些人曾經諷刺互聯網,稱自己原本希望得到的是一艘宇宙飛船或一輛會飛的汽車,卻最終得到了一個 140 字的推特。互聯網是很牛,但是互聯網很多事幹不了,而今天人工智能可以研究蛋白質的結構,可以讓自動駕駛、無人駕駛成為可能性,包括推動機器人的發展。
所以這是我第一個分享的内容——人工智能應當被視為一種賦能工具。之前一個經濟學家陳龍發表過一篇文章,我認同他的觀點。過去,互聯網常被視為一種「颠覆性」力量,我也寫了一本書叫《颠覆者》。但在 AI 時代,我們必須承認,AI 是賦能者,而不是單純的颠覆者。至于它到底能否颠覆,這個問題可以以後再讨論。
關于未來的六個趨勢:
網絡上有很多關于 AI 将颠覆各行各業的焦慮文章,但我認為最重要的是,AI 正在把所有行業、把所有賽道都重寫一遍。所以這可能是各位和我們最大的機會,所以不要刻舟求劍。
先説幾個預測/趨勢:
第一個預測是AGI(通用人工智能)和超級人工智能發展放緩。我曾經非常看好 AGI 的前景,甚至覺得它會在 2025 或 2027 年出現。不過現在看起來這個發展步伐正在放緩。
這兩天 Ilya 有一個新的演講,但是 GPT5 還沒發布,包括最近出現的一些新模型依然側重于多模态能力的提升,尤其是在編程和推理能力方面。OpenAI 最初目标是幻想構造一個全宇宙超級無敵通用人工智能,能夠在各個方面超越人類,現在我覺得這個事在邏輯上不太成立。
過去很多人認為,Transformer 模型模拟了人類的多層神經網絡推理,只要提供足夠的計算能力和數據,AGI 就會「自然而然」地出現。但是從現在來看,Ilya 承認互聯網上能用的數據用得差不多了,好像 AGI 也沒有到來。
有人説不是可以合成數據嗎?合成數據是能解決一部分問題,像數理化的推理合成數據可以。但是有個問題是,人類知識往高處走,越泛化還是越專業?當你從碩士到博士,再到教授,再到院士時,科技樹的走向通常是越來越專業化。
比如説如何寫一個作業系統,如何造一個戰鬥機?如何造一個航母?如何造一個發動機?這種知識并不在互聯網上,不是靠互聯網閲讀足夠多的網頁和八卦就能夠掌握的,而且現在合成數據不能涵蓋這個領網域。
有人説 O1 推理能力很強,但是 O1 沒有那麼神秘,其實國内已經有好幾家公司做出了類似的東西,核心就是通過思維鏈和強化學習,讓模型進行多次推理,并在得出初步答案後,反向反饋,檢查是否有錯誤。甚至我們試驗過讓百度先給答案,阿裏的來批駁它,頭條來收拾殘局,最後 360 和和稀泥。你們可以試一下 PlayGround,就讓國内大模型互相 PK 一下,每個智力都會提升很多。
所以 O1 的推理能力不細究了,我的觀點不代表真理。不過 O1 的推理能力比較難泛化是一個問題。因為要做強化學習就要有價值函數,價值函數就是得先判斷對和錯,數學題倒是挺容易判斷對和錯的,但是如何寫一個作業系統是一個好的作業系統,甚至説問題再小一點,如何寫一個浏覽器,它的價值函數怎麼判斷?
最後 AGI 我覺得一定會來到的,但是可能不是在今年明年。
第二個趨勢:大模型進一步發展,無論訓練還是推理,都在往專業化發展。
除了少數幾家巨頭公司,許多其他公司也在往更加專業的領網域發展。王小川轉向醫療領網域,但還是有點寬泛。最近很多人讨論的 MOE(專家混合模型)架構,實際上也是通過多個專家模型來組合能力。
我最近重新思考了谷歌的戰略,突然發現谷歌的戰略似乎有些後來居上的意味。大家可以想想,DeepMind 這家公司開發的 AlphaFold 在蛋白質結構解析方面幾乎無與倫比,AlphaGo 也曾擊敗了人類圍棋的超九段高手。但我們并沒有看到 AlphaGo 能寫詩,AlphaFold 能解奧數題,這些系統有其局限性。包括 AlphaChips,它專注于芯片設計,據説已經超越了人類設計師。那我們為什麼還要追求一個既能寫詩又能解奧數題的大模型呢?
第三個趨勢是模型越做越小。一年前如果站在台上我肯定不是這個觀點,大模型剛出來時,大家都在比拼參數量:你有千億,我有萬億,大家普遍認為只有參數越大,才能帶來更多的能力。
但經過這一年的發展,很多小規模參數的大模型架構開始嶄露頭角。小模型的定義變得越來越模糊,實際上我們正進入一個模型輕量化的時代。最典型代表是面壁智能,他們名字起得土一點叫小鋼炮。
包括今天模型要上手機,蘋果在手機上也會有一個非常小的模型,微軟也在探索 1B、2B 參數規模的模型。所以模型不一定越做越大,因為越做越大的話就變成馬斯克的遊戲了,他确實有錢,一説就是 10 萬卡集群,要買個核電站,如果模型都是這個玩法,那跟大多數人就沒有太大關系。
第四個趨勢:訓練數據質量提高。過去有一個誤區,大家覺得模型越大能力越強,但還是面壁智能提出一個能力密度的概念,實際上是知識密度,就是大家發現過去以為模型越大,能力越強,才會湧現。但現在發現模型雖然小,只要知識含量高、知識純度、知識質量高,也能展現出強大的能力。
比如把大模型想象成人,有兩個大學同學,一個特别聰明,腦子容量特别大,天天在網上看八卦,你問他誰跟誰出什麼事他都一清二楚。另外一個同學大學一年級只做高數題,就把高數 3000 個題做得滾瓜爛熟,誰的高數推理能力強?一定是後一個同學,但是你問他湯姆漢克斯的媽媽是誰,他可能回答不了這個問題。
現在,全球做大模型的人都意識到這個問題了,我們把互聯網上的八卦拼命學進去之後,變成了一個快速問答的知識小能手,但是推理能力并沒有特别強。所以 O1 走的就是另外一條路,它很多問題回答不了,但是不影響它的推理能力很強。
所以真正知識今天不在互聯網,而是在很多專家腦子裏,在很多公司内部業務流程裏,那現在這些知識可能是通用大模型的廠商搞不到的。所以大模型的能力增強需要依賴其他途徑。
小模型能力增強方法就是多推理幾次,大家本來覺得 Scaling Law 碰到了障礙,大家以為老黃的顯卡賣不動了,又發明一個方法——不依賴快速思考,而是通過慢思考來增強能力。慢思考并不是讓模型立即回答問題,而是讓它自己在内心中反復推理,消耗更多算力,這也能顯著提升小模型的推理能力。
吳恩達老師有一次講:如果我用 gpt 3.5+一個 Agent 框架,能力可以超過 gpt 4.0,開始我沒有理解什麼意思,後來發現當大模型通過快速思考直接回答問題時,其答案質量可能不如通過一個較小的模型,先進行反思、反復推理,并自我糾正後得到的答案。
最後一個好消息,大模型發展趨勢之五——成本越來越低,現在行業裏還有人整頓開源好,閉源就好嗎?騰訊混元都開源了,千問開源一直做得不錯,開源越做越好,能力上來了,開源成本基本為 0,盡管訓練和推理的成本依然存在。
國外和 GPT4 等效的模型價格下降了數百倍,國内抓緊時間用他們的 AGI,比如説混元開源了,你自己部署一套,自己成本比直接接他們 API 都要貴很多。
他們投了那麼多 Infra,投了那麼多顯卡,三年以後就折舊折完了,不用也是白費,他們給的 API 價格都是低于成本價,所以大家可以用起來。
第六個趨勢,InfraStructure 投資已經差不多告一段落。為什麼?看看英偉達股價就知道,英偉達賣了無數顯卡。為什麼有人在懷疑人工智能有沒有泡沫呢?實際上大家花了幾千億美金買這麼多顯卡,實際上是給了一個信号——基礎設施已經準備好,該做應用了,這一點很像互聯網第一次泡沫破碎的時候,思科賣了無數路由器,各個國家拉了很多海底光纖,但是沒有應用,第一輪互聯網泡沫就破碎了,而基于這些基礎設施的很多互聯網應用做了起來。
目前開源能力和 API 能力肯定是準備好的,所以 2024 年是應用場景之年,2025 年是 Agent 之年。
我們現在談大模型,很多事混在一起談不清楚的,我還是希望抽成兩條路:一條是 AGI 之路,這條路承載了人類夢想,讓有錢人繼續卷數據、卷算力,朝着萬億十萬億參數發展,最近 X.AI 三個月就搞了十萬卡集群,中國還是萬卡集群。但是這條路跟大家沒什麼關系,反正大家都面臨人生痛苦的問題就是沒錢。
他們有些公司就沒有搞清楚自己究竟是做 AGI,還是在做應用。這條路不要搖擺,要堅定地選擇一條路走到黑,别做着做着説我是在大模型的通用能力,做着做着説我又做了一個場景應用來證明我的能力,這完全是兩件事情。
我有一個觀點,我們都説大模型要掀起一場工業革命,但怎麼掀起工業革命呢?就得把大模型拉下神壇,大模型要往產業化、垂直化、場景化、應用化發展,所以做場景、做產品,我覺得一點都不丢人,正因為有無數的應用,互聯網才能起來,否則互聯網光靠海底光纜、靠思科的高端交換機,是沒有任何意義的。
AGI,我今天就不談了,這是少數巨頭的遊戲。我這次去美國也見了一個 VC,已經沒有人在投做通用大模型的公司了,Anthropic 後面是亞馬遜,OpenAI 背後是微軟,再加上老黃、馬斯克等,你能數得出來在美國做這樣的公司不會超過 10 家,而且這個格局确實對「門票」的要求太高。我們國内有些創業者還是很聰明的,表面上看來在做通用大模型,實際上他的錢都拿來做投放了,這是非常 smart 的做法,因為投放好歹能弄來用户數據,你説預訓練,訓了大模型,還不如開源微調的好,這錢不是白花了嘛。
走應用之路,我的意思是讓大模型從「原子彈」變成「茶葉蛋」,别再卷算力、卷數據、卷參數了,説白了,我覺得走應用之路的一個非常重要的理念,就是不要期望大模型什麼都能幹,我們前面被誤導太久了,大家陷入了迷思,天天出來「秀肌肉」,就是大模型什麼都能幹,好像無所不能才叫大模型,你公司裏雇過這樣的員工嗎?請了一個司機,又能當保镖,又能當司機,又能當保姆,還能做飯,還能給你揉腳,還能寫程式,還能做公關,還能拍短視頻,還能剪輯,要碰到這樣一個人,他自己就創業了。
所以要做專業大模型。去年看了一個電影,有句話説的特别真理,説「解決問題的關鍵,就是找到關鍵的問題」,我覺得解決問題的關鍵就是放棄對大模型的執念,不要高估它的能力,當然我們也不低估它的潛力,讓一個大模型就幹一件事,換這樣的思路去想一想,會發現模型更小、算力更少、成本更低,而且應用難度更低。
大模型是能力,不是產品
所以大模型是什麼?我從一開始賭錯了很多東西,唯一賭對的東西就是我一直不相信大模型是產品,我也一直不相信大模型是作業系統,你把什麼東西比喻成作業系統這就壞了,全世界就需要 3-4 套,還有你什麼事?
大模型不是作業系統,有人老喜歡拿雲計算做比喻,我後面會講到大模型也不是電力,大家一想到電力就想到了雲計算,就應該在雲端,但大模型更像一個電動機,所以大模型是能力,不是產品,能力是什麼概念?
能力很好,但是要結合應用場景才能產品化,大模型是要藏在產品後面,所以我最喜歡的產品經理是誰你們知道嗎?你們喜歡周星馳嗎?看過他很著名一部教人怎麼做產品的電影嗎?叫國產《007》,我就經常反省,它裏面最經典的例子是這看起來像一個刮胡刀,實際上是一個吹風機。
今天無論各位女士用的吹風機,還是男士的刮胡刀,還是電牙刷,還是掃地機,裏面都藏着一個電動機,但你意識到電動機的存在嗎?不存在。會有人買個電動機回來接上電説:來,給我轉個 27000 轉嗎?也不會。
實際上你買了一個電動機你要裝上輪子才能變成汽車,裝上扇葉才能變成鼓風機,裝上齒輪才能變成傳送帶,大模型這個東西挺庸俗的,它就是個電動機。
我今天講的就是要把大模型拉下神壇,不供着它,不頂禮膜拜,好像幹大模型就積極偉大,其實這東西要變的很庸俗。
當年 IBM 做出超級電腦之後,就跟今天的超算一樣,説全世界五台就夠了,最後超算真正沒有掀起信息革命,掀起信息革命的是誰?是 PC。PC 最早從蘋果 2 開始算,到 IBM PC 到微軟的成功,把這玩意做得跟玩具似的,今天我們做的伺服器端都是 PC,PC 進入了百行千業,進入了千家萬户,這才能掀起工業革命。
AI 能不能颠覆?肯定最終是能颠覆的,因為啥都能颠覆,你把東西做的比别人便宜很多也能颠覆,你能在晚上不需要開倉儲,在網上直播帶貨,一分鍾能賣出 1 個億的東西也叫颠覆。
但是從 AI 來講,我的建議是不要一上來就想着颠覆這個、颠覆那個,先想想賦能,就是當你有了一個電動機之後,如何取代原來的蒸汽機,如何取代原來手工幹的事情,能不能潤物細無聲的嵌入到應用場景中,不是不可以做新東西,但這裏面最大的機會是有了 AI 之後,有了生產力提升、生產力賦能工具,很多產品可以重做一遍。
走應用之路,我覺得要對大模型的能力重新做一個劃分,因為我覺得過去兩年裏面,我們都被自己誤導了,你看各公司一説大模型,出來講案例,都是講它的兩層基本能力,都是講寫詩作畫寫文章、閲讀理解、翻譯、編程,實際上我把這個定義成它的基本能力。
比如説大模型的 AIGC 這面,有可靈、海螺、vidu、即夢,這兩天 Sora 出來了不過沒有那麼驚豔,這些模型是落在創作和營銷能力。但是多模态能力值得大家關注,這兩天 Gemini 2.0 它把多模态能力展現到極致,但是多模态能力和 AIGC 還是要劃分開,因為兩個用處不一樣,所以要結合場景,而不是籠統地説能夠處理圖象、視頻、聲音是多模态,原來我認為能產生視頻影像也是多模态,這個概念不一樣,我覺得理解非常重要,因為它是讓大語言模型從看見、看懂到理解的重要差别。
業務能力的對接也至關重要,特别是如何與企業的核心業務相結合。比如,情報分析、知識管理、業務自動化以及組織協作等,這些能力過去常常被忽視,但它們正是人工智能能夠提升企業生產力的關鍵領網域。特别是在自動駕駛這種新興產業裏面,具身智能這些創新能力,實際上提供了新的工作範式。
還有一個場景是 AI for Science,在座諸位也有人在這個領網域可以思考一下,未來科學研究可能有一些專業模型來輔助,AlphaFold 就是是一個例子。
所以如果有人在這個基礎上把模型能力分得層次更細,分得更多是沒有問題,用户購買的并不是工具本身,而是一個切實能夠解決問題的結果。所以大模型過去兩年裏面,大家自嗨太多了,不斷説這個能力那個能力,今天要搭一個橋,而是要看這些能力到底給企業、用户創造什麼價值。
六個方向裏,有哪些機會?
我大概列了六大應用方向,看看大家是不是能夠在這六大方向中尋找創業和創新的機會。
第一是人人智能。
我一直認為 AI 是人類有史以來發明最重要的生產力工具,除了對企業提升生產力之外,對個人來説,我覺得它可以解鎖你很多不具備的能力,甚至讓我們個人具有超能力,比如説不會做音樂的也能產生音樂,不會作畫的也能把想法變成海報,所以大模型要提高每個人的生產力,打造個體的超能力,這裏面有很多機會。
大模型在第一步,盡管大家都想着做工具的人挺吃虧的,賺工具的錢還不如做社區的,做社區有網絡效應,工具的話用完就走,但是大模型首先工具屬性還是非常重的。所以在這一塊,大家可以想一想,當然不要只是去賣課,賣課是不成功的模式。
360 在這做的是納米 AI 搜索和 AI 辦公大全,是瞄準了幫助個人來提高個人獲取信息、分析信息的能力,這一塊有很多機會,就看能不能深入研究,人還有哪些能力可以被 AI 去提升。
第二個方向:從萬物互聯走向萬物智能。萬物互聯的觀念,IoT 的概念已經很成熟了。現在 AI 的發展從雲端到終端,從雲端到邊緣,模型越來越小,現在像蘋果手機的策略是手機上有個小模型跟雲端模型星座,榮耀的照明説,手機算力、芯片發展到 2027 年手機上上個百億的模型是沒有問題的。除了汽車,明年以後沒有大模型上車的車可能賣不掉了,聯想也在給 PC 上模型。
我們想的更廣一點,所有的智能硬體如果都跟大模型發生關系,但是不是把一個通用大模型連上來,而是在所有智能硬體上有一個專業模型增加一兩個能力會怎麼樣?
比如説半夜裏肚子餓了,打開冰箱找瓶啤酒,冰箱能夠跟你説話,它看見你,它告訴你太胖了,不要在晚上再喝啤酒了,而且它會自動給你的監護人發個短信。
那有人老説要做新的硬體,AI Pin 大家都知道比較失敗了,他們畫蛇添足非要帶一個投影儀,還要做手勢,手機被證明是人類比較能接受的随身攜帶的物品。還有戒指、手表、眼鏡,Meta 最近做了一個眼鏡,也是蠻成功的,我也準備推出我們的納米眼鏡,這不是玩笑,因為蘋果做 Vision Pro,老是想做 VR 和 AR,這個搞得眼鏡太重,功能太多。但是大家發現如果眼鏡跟 AI 搜索結合起來和拍照結合起來,變成輕量級的,據説 Meta 眼鏡賣了好幾百萬副眼鏡了。在大模型的推動下,元宇宙、虛拟現實有可能夢想成真,大家想想智能硬體是不是會有機會?
第三個機會是,在中國做事情要順勢而為,國家很重要的戰略是傳統產業數字化,有一個詞叫數轉智改,也是新質生產力,大模型特别适合提升打造新質生產力。
如何幫助企業數轉智改?大模型可以發揮很重要的作用。現在通用大模型肯定不适合給企業去用,我問過很多企業家和政府領導,通用大模型因為并不了解内部業務,所以説的話比較泛泛而言,而且這種聊天你們如果做過企業級應用就知道,這種 Coplot 的模式是企業最不能接受的。如果你們做過企業級應用就知道天天請一個聊天機器人回去,頭三天還能有興趣聊,長期對工作效率提升沒有意義的。
在企業内部我也講不要幻想用一個大模型解決所有的問題,企業内部将來一定是多個業務智能體的組合,背後是多個業務大模型,這目前是最大的市場,而且這個市場需要你沉到行業裏,沉到客户裏,,因為很難有通用的解決方案,這裏面提供了比 SaaS 更大的機會。
第四個方向是未來和新興產業。
比如説生物醫藥、具身智能(人形機器人)、低空經濟(無人機),無人機是颠覆式的創新,還有就是智能網聯車的自動駕駛到無人駕駛。這個行業裏面如果不用大模型,這些行業都做不起來,因為大家想想為什麼最近特斯拉 FSD 可以實現端到端的自動駕駛,端到端有兩個解釋,我們學術上是説基于訓練學習的方法取代了基于規則的方法,用一個黑盒子系統,從輸入到輸出。也有人把它解釋為從一個停車位到另一個停車位,不知道哪個解釋更好。
第五個機會是打造科研新範式。大模型工作範式很簡單,就是給我好的例子,經過足夠學習之後就能產生舉一反三的湧現理解,以後就能模仿;而基于規則,我曾經跟做自動駕駛的人聊過,他們大概自動駕駛的規則,像蘿卜快跑就是基于規則做的,據説規則有幾十萬條,所以你要想吓唬一個蘿卜快跑,只要把自己化裝成熊貓在馬路上過,我打賭百度肯定沒有寫規則,如果遇到熊貓在路上是撞上去還是應該停車。但是我在學駕照過程中深刻領悟到人的泛化能力,無論是否放個紙箱子,還是放一個塑料墩子,我都能靈活地繞過去。
包括具身階段沒有大模型的加持也是不可能的,原來深圳有一家公司叫優必選,大模型出來之前,它快成玩具公司了,他們機器人主要在表現團體操,但是有了大模型之後,這個公司就迅速地迎風而起,所以新興行業對大模型的借鑑是非常多的。
AI for Science,我只能説個方向,這個具體我也不懂,但是值得關注,就是它是科研的新範式。
大模型的本質在于對語言、影像、視頻和聲音的理解,但其核心原理是将訓練數據轉化為一種序列,稱為 Token。雖然「Token」這個詞的翻譯可能存在歧義,但從本質上來看,如果你能将需要處理的數據轉化為 Token 序列,那麼就有可能通過預測下一個 Token 來獲得有意義的結果。這也是為什麼 AlphaFold 能夠成功的原因。它将蛋白質的結構視為一種序列,而人類已經研究出這些序列的規律,可以作為樣本進行學習和微調。接着,AlphaFold 使用 Diffusion 方法随機生成各種可能的結構,并對這些結構進行判斷。
這種思路不僅可以應用于蛋白質結構預測,也可以擴展到其他領網域。例如,天氣預報、股市預測、交通分析,甚至工業領網域中的生產控制,都可以通過将行業數據序列化來進行處理。這時,并不需要依賴大語言模型的語言處理能力,而是要找到一種方式,将行業數據轉化為可以進行序列化的形式。一旦數據能被序列化,Transformer 模型就可以用來嘗試預測和推理。
我曾經發過一個關于人類長壽的視頻,提出人類有可能活到 150 歲。雖然這個觀點聽起來似乎很極端,但美國在醫學領網域的觀點也支持這一想法。英偉達的創始人黃仁勳多次舉例提到,人的細胞最終也會以一種序列的形式表達,而人類基因的表達同樣可以視為一個序列,甚至新藥分子的分子結構也能以序列的方式表現。研究人員認為,只要能夠将某個領網域的内容轉化為序列,Transformer 和 Diffusion 等技術就能進行有效的預測和推理。
在中國,關注這個領網域的人還相對較少。微軟研究院的前院長馬維英博士,現在在清華大學專注于醫學和生物領網域。我相信,未來會有更多的領網域等待着通過 Transformer 和類似的技術進行改造和創新。
第六個場景,就是安全場景。
為什麼要加這個場景?因為我是做安全的。這裏面談的主要是 AI 安全。在很多場景中都涉及到大模型的應用,AI 的安全性顯得尤為重要。順便提一下,最近 Ilay 提出了一些聳人聽聞的觀點,他認為未來的智能必然依賴于推理,而推理會帶來不确定性,不确定性會導致幻覺,幻覺進一步演變為意識。因此,他強調了人工智能安全性的問題。但我個人認為,專業領網域的大模型不太可能產生意識,就像你雇傭一個專業員工,他不太可能會摧毀你的公司業務一樣。有超級人工智能才會對人工智能的安全構成終極威脅。通用人工智能方面只有幾個問題:
一是數據隐私保護和數據投毒污染的問題;二、注入攻擊的問題;三、幻覺;四、AIGC產生的虛假信息問題。
我們提出的思路是以模制模,用魔法對付魔法,用專業安全大模型對付安全問題,所以安全問題不是今天重點。
如今,發展專業大模型的核心已經不再是大模型本身,而是找場景。找場景對大家最大的挑戰,是要對某個行業、某個業務有深入的理解和了解,如果業務不了解,天天在玩大模型,天天用大模型做一些屠龍之技,在炫技,這個很可怕,再怎麼炫,OpenAI 明天發布一個新功能,把技術一下就覆蓋了,OpenAI 和這些巨頭今天他們最缺的是行業和領網域知識,這在美國也不例外,比如説現在美國有很多創業公司是悄無聲息的在做金融的解決方案、醫療的解決方案。
我簡單提出四個發展方向,或者説四個「十倍」目标:
一個方向是對上,滿足老板和高管的需求,比如説這次張鵬推薦的做面試的一家美國公司,他們兩頭通吃,他們做了兩個領網域,先做人人智能領網域,做了一個作弊工具,你面試的時候能夠幫你在旁邊提示如何回答面試官問題。他們又做了一個數轉智改的應用場景,幫助老板解決如何利用機器,HR、主管面試個人的問題,所以想想都很美,大家都用他的軟體,機器人面試機器人,但他掙了兩份錢。
第二個方向是對下,是面向員工,看員工有什麼痛點和剛需?
第三個方向是往内看,企業内部如何提高自己的效率,内部有什麼管理業務流程;
第四個方向是往外看自己的產品和服務體系能否找到企業的卡點,卡點的一個衡量指标是説能不能減少 10 倍的人力、降低 10 倍的成本、提高 10 倍的效率、提升 10 倍的體驗。
我跟河北鋼鐵企業在談的時候,談到群體智慧,過去你想幹、幹不了的事,今天大模型能幹了;過去你想解決、解決不了的困難,今天大模型能解決了,就找這種卡點和堵點,這就是大模型應該發力的地方。所以一定要細分場景,包括要把業務流程拆解的足夠細,大模型初期的時候,我至少做了 100 個失敗的案子,你們别聽今天很多人上來説六小虎接了多少大模型的例子,其實很多項目都難以交付,我也吃過這種虧,剛開始大家對大模型都極其崇拜,有人來找我説,鴻祎,我們做個養豬大模型,也會有人説我們做個鋼鐵大模型,還有人説做個醫療大模型,你反問他一個問題,大哥,你要解決什麼問題?你把他給問死了,因為都不知道要解決什麼問題怎麼做?最重要的是一定要細分場景。
舉兩個例子,河北省的鋼鐵是最發達的,大家都知道中國的鋼鐵含量不含河北,河北的鋼鐵產量不含唐山,唐山的鋼鐵產量不含遷安,我們就到遷安去了,他們最開始也説要提升鋼鐵的生產效率、提高鋼鐵的質量,我們都認同這個目标,但他們説要做鋼鐵大模型,我想沒有鋼鐵大模型,只有細分的場景,所以他們就把鋼鐵的整個過程列出來了,把流程劃成了 142 個場景,分的特别細,這 142 個場景,可能有些場景都能單獨訓一個大模型出來,或者單獨做一個智能體,你要分到這麼細的程度才可能解決傳統企業數轉智改的問題,否則只做一個問答、只做一個 Copilot、只做一個辦公,這些通用方案都可以解決他們的問題,如果真的要直接提升生產力就得分析到這種程度,但這種程度,我覺得巨頭一個都幹不了,實在太細致了,OpenAI 也幹不了,因為它沒有這樣的數據和知識。
再舉個更簡單的案例。這次我在美國見了一家跟王小川做同行的事情,但做法是不一樣的,你們可以聽聽差别,對比一下,覺得是小川的好,還是這家公司的好,這家公司是中國小夥子創辦的,他們跟斯坦福醫療中心籤了一個約,美國看病跟中國看病不一樣,我一會要去看病,直接到醫院挂個号就行了,我想到斯坦福醫學院挂号,人家不給我挂号,説需要你的家庭醫生或者社區醫生先看過,然後發傳真,把你的病情情況介紹給我們,我們再預約某一個時間來看病,他們把這個場景分的很細,發現了三個卡點或者三個堵點:
斯坦福醫學院有 100 多人的隊伍每天收傳真,美國現在還在用傳統的傳真,傳真才有法律效率,醫生寫字是全世界最潦草的,所以看傳真的人都很費力,所以要打電話來回多次确認才能把你登記到數據庫裏,還要給病人打電話預約看病的時間,病人看完病之後要到保險公司報銷,這也是一個挑戰。
保險公司會拒賠,他們要請很有經驗的專家有理有據的寫一個為什麼我這個病,根據我的診療過程,寫最後能夠報銷多少,這家公司做了三個 Agent,相當于是三個大模型,第一個是多模态大模型 OCR 識别傳真,現在比人做的好,可以把 100 多人看傳真的隊伍給取消掉了。
第二個場景是數字人用語音和病人打電話,因為這個打電話不是通用客服,是來回預約時間。
第三件事,他們把醫院裏歷史上給病人寫過的十幾個萬份給保險公司的報銷報告訓練成一個知識模型,人家不是一個通用寫作產品,不是説給我寫一篇小説,就是專門寫如何給保險公司報銷的。
他們就做這三件事,就是一個很了不起的項目,這就是典型的幫助傳統企業數轉智改,為什麼醫院願意付錢?醫院能算出節省的人力、能算出提升的效率、能算出工作量,這和我們原來做工具有個最本質的不一樣,比如説很多時候企業買了我們的軟體,為啥中國的 SaaS 付費一直做不起來,一個很重要的原因是你的軟體有沒有也不是特别重要,所以提高效率也很難算。
原來我們做的軟體是什麼概念,還是人的工具,但今天AI在這些關鍵點上,AI 基于一個大模型,封裝出來了 Agent,實際上是一個數字專家,是一個數字員工,完全可以直接取代人的工作能力,這個企業的付費意願就比原來提升了很多。
如何做好專業大模型?
做專業大模型,最重要的有這幾個點:
1. 知識管理。很多失敗的例子,是因為客户的數字化做的不好,沒有足夠多的知識,比如説斯坦福如果收到的所有傳真都銷毀掉了,沒有過去歷史的數據做訓練,這個事不一定能做到,如果過去寫的保險公司的報告都沒有了,可能也無從訓練,所以知識非常重要。
2. 業務大模型打造。這就比較容易了,用通用大模型進行蒸餾變成基座大模型,而且從現在的趨勢來看,微調用的越來越少,RAG 用的越來越多。
3. 構建智能體。Agent 就不展開講了,因為 Agent 過去是一個技術輔助,但今天 Agent 成了我們今天給企業做做應用的核心訴求,最近我準備把我做的 APP 都改成 Agent,你賣一個 APP 給企業,聽起來就像賣了一個軟體,軟體不值錢,但是我的 APP 全都變成了 Agent 之後,我賣的就是數字人,你雇一個人得 2 萬塊錢,我這一個月才 1000 塊錢,多便宜,價值感馬上就不一樣了。
4. 融合工作流。為什麼大家現在談 Workflow?你們都知道 comfyui,它的功能強大,就是因為它知道很多節點只能完成單個任務和單個技能,很多時候我們要把技能組合起來才需要 Workflow,所以 Workflow 會變的很重要,因為沒有 Workflow 你就做不出復雜的智能體,就做不出合作的智能體。
5. 知識管理。大家要有思想準備,這比訓大模型還困難,真到一個企業之後,發現他的知識都是暗知識、淺知識,有些知識藏在大數據裏,需要把大數據進行加工,有的知識存在人的腦子裏,有的知識存在員工的硬碟裏,有的知識存在工作流程中。比如我們經常説一看你就是新員工,一看這個人就是老員工,為什麼?因為他有很多公司潛規則的知識,如何把這些知識能夠訓到你的大模型裏去,如何能搜集出來?所以我提出一個概念叫知識捕獲,采集都不一定采集得到。
6. 業務大模型打造,要做 RAG。
7. 構建智能體。智能體最早是調 API,我問個問題向大家請教,最近 Claude 推出 MCP,我的理解是用大模型做一個黑盒子,自己調 API,我覺得這個模式應該不 work,最好的模式還是應該由 Agent 來調 API,Agent 來調大模型,由 Agent 來做整體的協作,為什麼?
因為 Agent 有個很重要的價值,要實現慢思考能力,這個能力是由 Agent 多次調一個或調多個大模型,當多個大模型協作的時候,Agent 它負責發起協作并在大模型之間進行有效的調度。
2025 年是 Agent 之年,包括把日常重復性的業務流程形成 Agent,自主性的響應。
8. 融合工作流。可以認為是 Agent 作業系統,就像今天人會用釘釘、企微,另外我聽到上一個 Speaker 講一人公司、兩人公司,我這裏吐槽一下,我認為不可能,别被這種東西忽悠,你們讀一讀赫拉利的書,智人之所以成功,因為智人是最懂得群體合作的,人一定需要團隊合作。
所以我們企業級的,今天釘釘也好、飛書也好,并不是為 Agent 打造的,還是為人打造的,這在未來也是一個巨大的方向,相當于是 Agent OS,如何把 Agent 工作流能夠做好,當然我不能透露我們在做。
我們有一點要向美國的創業者和投資人學習的,他們編的詞特别打動企業客户。他們在重新定義 SaaS,SaaS 原來的定義是什麼?Software as-a Service,現在他們重新談了一個新概念,叫Service as-a Software,這就像繞口令一樣,什麼叫 Service as-a Software 呢?
過去有很多事是軟體幹不了的,或者軟體只能起到輔助工具的作用,比如説看傳真,雖然有了傳真機,還得有人在讀傳真,往數據庫裏錄入,寫保險公司報銷報告,或者律師給你寫個檔案,都是人寫的,這個市場叫 Service 市場。
美國的 Software 市場大概是 1 萬億美金,但是 Service 人力市場是 10 萬億美金的市場。有了大模型之後,在一個細分的節點上,它可以取代人,或者可以該原來幹不了的事,可以解決原來解決不了的困難了,意味着這個 Service 可以用軟體來幹了,意味着軟體從原來 1 萬億美金的市場在往 10 萬億的市場上在侵蝕,這給我們做軟體的人提供了一個 10 倍的機會,從企業級市場到智能軟體反攻服務市場。
過去我們交付的是軟體,今天直接交付的是能力,換句話説,直接交付的是人力,我覺得未來 APP 還會在,看最近智能手機的演示,Siri 可以直接操縱各種 APP,甚至是智能體和 APP 最大的差别,APP 做的再牛,還是給人用的、是人的輔助工具,但 Agent 可以自主或者應人類要求獨立地完成一個任務,換句話説,過去是工具輔助人創造價值,未來 5-10 年會變成AI直接創造價值,這就是各位最大的機會。
最近網上流傳一個視頻是在斯坦福的内部錄像,主持人講了一個故事,我可以把這個故事分享出來作為我的演講結尾。大模型不是中心化雲化的電力,大模型是去中心化的電動機。
他講了最早工業革命在電動機取代蒸汽機,用了 30 年,為什麼用了 30 年?因為蒸汽機一般的企業很難用得起,所以一個工廠如果有一座蒸汽機,蒸汽機給工廠裏所有需要動力的地方都提供動力,但是蒸汽機是通過很長的連杆來輸出動力,所以連杆的強度有限,不能太長,工廠的布局是以蒸汽機、鍋爐房為核心,來做工廠的布局和業務流程的設計。電動機剛發明之後,老板只是把蒸汽機換掉,換等了電動機,效率一點沒有提升,也沒有產生額外的價值,因為所有的東西都沒有變化。
後來經過了 30 年的技術發展,人們的意識和技術能力突然發現可以把電動機做小,今天小到一個電動牙刷裏也是一個電動機,實際上它和小米汽車用的電動機是一個基因發展出來的,但是一個 27000 轉蓬勃有力,一個就是給你刷牙用。
人們把電動機做小之後、做便宜之後,突然發現工廠裏的動力不需要中心驅動了,變成單元驅動了,所有需要動力的地方裝一個自己的電動機就好了,就像我説的,甚至工廠的格局都變化了,工廠可以變成不同的車間、不同的 Location,不同的 Location 之間可以用生產線、流水線連起來,工廠的鼓風機,包括紡織機都有各自的動力。
所以你們想想,如果不是這樣的革命,如果我們家裏買一個電動機,這電動機一方面給我們當風扇用,又給我們當吹風機用,一會還給我刷牙,還給我刮胡子,可以想象一下多可怕,買了一個大電動機,啥活都幹…… 這樣一來,整個工廠的業務流程、管理體系,甚至商業模式都逐漸地發生了變化。
如果這裏把電動機換成大模型,是不是很貼切?我們幹嘛一定要相信用一個 API 也好,或者用一個中心的超級無敵通用的大模型來解決我們在企業内部不同地方遇到的不同的業務問題呢?
現在大模型的成本很低,有開源的,有免費的,我們把每個大模型只幹一件事情,就當風扇用,就當傳送帶用,就當鼓風機用,這種新型的架構是不是代表了大模型将來在企業和在行業内部的應用場景?反正我是相信的。