今天小編分享的科技經驗:國產大模型,應該避免走入加拉帕戈斯時刻,歡迎閱讀。
在中國,大模型技術進化加速度的同時,淘汰也加速度。
短短兩年時間:大模型的戰争,就從 GPT 一馬當先,到國產大模型百模大戰,再到行業格局固定,只剩大模型五虎和幾個互聯網大廠。
在此期間,伴随模型大小一同膨脹的,則是算力、人才、電力、數據中心無數基礎資源的不斷加碼。于是,全球範圍内,英偉達的股價一路披荊斬棘,一年暴漲 7 倍,市值超越蘋果;各大機構大模型團隊,從研究員到助理,從教授到學生,接到的獵頭電話,頻率甚至超過了來自移動聯通的套餐更新問候……
然而,參數的加碼是無限的,資源是有限的,熱潮當中,長期無限制的基礎模型競賽,真的是一個正确的方向嗎?
宏觀經濟中,作為借鑑過河的對象,日本早已成為全球範圍内一塊被摸圓的石頭:尤其在商業社會,昭和年代之後,圍繞日本為什麼失去半導體、家電、電池等行業,一種名為「日本產業反思體」的文章迅速在全球走紅,其閱聽人群體之廣泛,堪比企業家版《意林》。
對于歷史的錯過,有人将原因歸咎于資本,有人将原因歸咎于時代變化,但這始終解釋不了為什麼在電視、電腦、芯片、面板、互聯網、電池這些截然不同的產業裡,日本貢獻了最多的諾貝爾獎,但在商業中,卻總是陷入相似的加拉帕戈斯陷阱:
所謂加拉帕戈斯陷阱,指的是加拉帕戈斯群島由于千萬年來與世隔絕,產生了與大陸極為不同的穩定生态系統,可一旦面對來自外來物種入侵,就面臨被淘汰的危險。
而在日本的商業社會中,日本電裝最早在 1994 年發明二維碼,結果發揚光大的卻是中國的微信、支付寶;20 世紀日本人做出了全球保質期最久、最優秀的存儲芯片,全世界卻在韓國人的帶領下愛上了良率不高卻足夠便宜的三星存儲;再後來,新能源時代,日本人一步到位發展起了最清潔的燃料電池,但新能源汽車卻在特斯拉的帶領下,集體奔赴锂電池的星辰大海。
為什麼明明技術遙遙領先,商業化卻仍舊顆粒無收?
這個困擾日本產業發展幾十年的問題,如今也值得被中國的大模型產業重視起來。
01 如何避免 AI 走入加拉帕戈斯困境?
以百度創始人李彥宏為代表,中國的大模型產業,正逐漸建立起一個新的共識:
正如同日本的諾貝爾獎數量并不直接決定其產業的強勢與否,對于 AI 產業,只卷基礎大模型,或許會是一段時間裡,行業最大的失誤。
一個最直接的原因就是,當所有資源全部被押注在基礎大模型的研發上時,直接帶來的,或許不是技術的突飛猛進,而是相同成果一遍遍的復現,反而帶來算力與研發資源的極大浪費。
百度創始人李彥宏|圖片來源:視覺中國
就拿算力來說,一般來說,訓練大模型的顯卡标準配置為 A100 與 H100。當前,一張 A100 售價大約 8 萬人民币,一張 H100 大約 15 萬人民币;而将他們組裝成衣務器,一個 8 卡的 A100 伺服器大約 130 萬人民币,裝配了 8 張 H100 顯卡的伺服器價格大約 200 萬元。
當然,這些全都有價無市。
而将其對應到模型側,訓練一個千億模型,大約需要用 1PB 數據,如果在 10 天内完成,需要至少一萬張 A100,對應購買伺服器的起步費用,就是 17 億。
此外,據報道,OpenAI 訓練 GPT-5 需要數萬張英偉達 H100 芯片,也就是說,相應的伺服器成本,将達到 30 億人民币上下,如果再算上數據中心成本、人力成本、電力成本,以及無數次推到重來的可能,需要的成本,幾乎相當于國内頭部大模型獨角獸的融資總額之多。
相應的,随着參數量的進一步暴增,基礎大模型将注定成為少數玩家的遊戲。
參數量與玩家數量的成反比之外,創投市場的悲觀,宏觀經濟的不确定,則又為這場基礎大模型的豪賭,添上了一抹不确定的色彩。
大模型研發要錢,而在沒有确定的營收之前,創投是核心的現金來源。但創投數據庫 IT 桔子的數據顯示,近兩年來,無論 AI 的融資規模還是數量,相比 2017 年前後的 CV 熱潮,都大有不足。但研發成本上,大模型卻是上個時代 CV 的數倍之多。
于是,AI 行業一個怪圈出現了:早期,每當 Open AI 有新版本的大模型發布時,過不了三個月,國内一大批企業,就會引用第三方數據于開源數據集跑分,開始不斷論證自家模型對各個版本 GPT 實現超越。
在這背後,為了迎合打榜需求,over-fitting(過拟合)也成為一個 AI 圈特有的現象,由于訓練過程中,模型對某一或者某幾個打榜用的開源數據集拟合過于精細,以至于模型記住了不少開源數據集特有的噪聲,從而打榜分數居高不下,但實際應用中,效果卻往往卻一言難盡。
用李彥宏的話來說,「百模大戰」讓我們建立起了追趕世界最先進玩家的能力,但當前業界過分關注模型本身,造成了巨大算力浪費,忽視了 AI 真正的價值所在——應用。
02 降低創新的成本意味着什麼?
如果只卷基礎大模型是一條錯路,那正确的方向在哪裡?
研究了無數日本的產業興衰之後,曾有專家總結,日本企業最大的問題,從來不是在于點錯科技樹,而是因為技術遙遙領先之後,沒有帶動更多玩家參與,讓整個產業鏈的成本一同降低,從而成為加拉帕戈斯群島中獨自演化的「怪物」。
比如,互聯網發明,萬維網是一切的基礎,但真正帶領產業蓬勃發展的,則需要搜索、電商、短視頻等萬億級下遊應用。
大模型同理:少數玩家高端競技之外,如何讓大模型吸引更多生态玩家一同參與擴充應用市場,或許是這場曠日持久的大模型戰争中最關鍵的賽點。
如何解決這一問題,在不久前的世界人工智能大會上李彥宏明确指出了百度的思路:智能體代表着 AI 時代的未來趨勢,由于它門檻足夠低,可以「讓更多人進來。在此之後,整個社會的創新,就會像 90 年代中期時候的互聯網網站,誕生數以百萬計的網站大浪淘沙之後,指不定哪條路就跑通了,從而誕生 Google、Facebook 這樣的 Super APP。
近十年,百度 AI 相關的研發投入超 1400 億元,基于以上投入,百度同時也是全球為數不多的、有着應用、模型、框架、芯片四層全棧布局的 AI 公司,其文心大模型的日均調用量更是已經突破 6 億次。以此為基礎,百度還先後上線知識庫、插件、自動追問、長期記憶、多尺寸模型,來完善智能體的生态。
目前,通過百度智能體,創建 AI 原生應用的開發将變得像拍短視頻一樣簡單,甚至一句話就能創建智能體。哪怕一些復雜的智能體創建需求,用戶也能像搭樂高一樣,靈活調用、組合各種工具。
文心智能體平台截圖
這種極低的創新成本,換來的是洶湧而來的生态玩家:截止目前,百度文心智能體平台吸引了 10 萬家企業、60 萬名開發者,覆蓋了上百個應用場景。
比如主業是做教育培訓的上海英孚教育,通過智能體打造了用戶的專屬英語顧問,不僅能「因材施教」為咨詢客戶推薦課程、外教,還能根據用戶地址、需求,提供就近的培訓地點,讓企業的線索有效率大幅提升。
當然,降低門檻只是產業做大重要一環,但更重要的是,降低門檻之後,如何創造營收,讓雪球越滾越大,讓創新成為一個穩定自循環的生态。
03 為什麼超級市場,才是大模型生态的最後一環
日本為什麼總在發明,又總是在錯過?
曾有學者復盤,很多技術,日本人發明之後,往往被中國人與美國人接手,才正式發展壯大,比如寧德時代的很多技術脫身于日本的 ATL,二維碼在日本發展二十年,不如中國一場移動支付帶來的普及效果。
技術創新到形成產業,中間的催化劑是超級市場。只有超級市場,才能讓所有的參與者賺到錢,也只有賺到錢,才能越過技術一時的領先與否,決定技術長期的生命力。
圍繞這一目标,百度逐步打造了涵蓋智能體開發、分發、再到變現解決方案的全新生态。
「目前百度已跑通了智能體生态的閉環,不僅人人可用,還能人人可開發、人人可分發、人人可獲益」。9 月 12 日,百度集團資深副總裁、百度移動生态事業群組總經理何俊傑在 2024 年百度聯盟大會上表示。
百度集團資深副總裁、百度移動生态事業群組總經理何俊傑|圖片來源:百度
在分發環節,百度構建起了「1+N」的流量分發生态。這裡面,「1」代表搜索消費場景内的分發,「N」則是在多終端場景的覆蓋,開發者僅需一次開發,就能在百度搜索及文小言、小度、貼吧、網盤等百度的多樣化、多終端場景的終端生态中進行智能體部署分發。
其中,以百度搜索是天然智能體分發池,當前,百度搜索每天請求量幾十億次,其中很多需求都可以被智能體滿足。比如,百度針對高考開發的高考智能體「AI 志願助手」,通過智能分析,能為考生量身定制志願方案。高峰時每天有超 320 萬考生通過百度高考頁面,直接搜索「高考 xx 分能上什麼大學」,或進入「AI 志願助手」獲得針對性的分析和決策參考。
在變現環節,百度正逐漸把智能體引入到百度聯盟這個大生态,持續為聯盟夥伴提供商業化價值。
過去,PC 時代,百度聯盟結合百度搜索,一度搶占了絕大部份線上廣告份額;移動互聯網時代,百度聯盟則結合百度 APP、貼吧、地圖為核心的移動產品矩陣以及手機廠商等終端,進一步擴大線上廣告的市場規模,并催生出「内容 + 廣告」的新型商業模式。
根據官方數據,用戶側,百青藤 24 年 DAU 覆蓋已超 8 億、百青藤變現能力提升 30% 以上,通過不斷提升系統承接能力,保證優質流量承接,百青藤入口請求量年同比提升 27%。商家側,目前已有超 2 萬個智能體使用了商業組件。截至 8 月底,每天有超 1.9 萬家企業使用商家智能體,覆蓋教育、房產、機械等 30 多個行業。
近日的百度聯盟大會上,百度還全新推出智能體聯盟解決方案,為企業帶來新場景新流量,及新的變現機會。
其中,在變現環節,百青藤攜手文心智能體平台,推出了創新變現解決方案,通過創新廣告和服務直達廣告,可以實現與文心智能體平台、智能體開發者之間的互利共赢局面。
此外,百度還推出了【分發 + 變現】一體化解決方案,通過「流量 + 能力」的雙變現通路,實現智能體開發者、百青藤、聯盟合作夥伴的三方共赢。
比如,用戶點擊播放《唐朝詭事錄 2》後,下方關聯内容會推送故事角色「裴喜君」的角色智能體,并以劇中熱點問題巧妙地将觀眾引導至智能體互動界面。通過數輪深入交流,适時推送高度匹配的廣告内容,進而實現内容與商業的無縫融合。
再比如中國供應商網,在接入百度智能體變現插件後,智能體能夠精準地把握買家采購意向,積極高效地和平台買家溝通,并深度挖掘采購細節,比起原有的表單提交系統,信息完善率提升 87%,轉化率提升 31%。再加上智能體後台的個性化配置,中國供應商網還可以根據自身需求不斷調整優化,挖掘和滿足 AI 時代更多的用戶訴求。
而在高三網,用戶則可以借助智能體組件,通過智能引導與關鍵詞提問,探索并查閱到更為廣泛且相關的内容,這讓高三網的資訊内容矩陣對于用戶搜索的目标信息能給出更多元的解答,為用戶提供了快捷、高效的搜索體驗。商業化層面,智能體在短短一周内就實現落地上線,相較于傳統廣告,為高三網帶來的整體收益提升數倍。
至此,技術為根基,智能體為手段,百度聯盟帶來廣闊的應用空間,百度正式跑通了大模型從研發到落地的生态閉環。
04 尾聲
做出全球領先的基礎大模型,還是一句話創建智能體,用大模型變現?
兩者相比,或許後者并不是一個如同奧特曼一樣能站在世界聚光燈舞台上改變世界的炫酷行為,而是更像是商業社會中「低垂的果實」。
但事實上,只有通過百度智能體,讓「人人可開發,人人可分發,人人可獲益」,讓整個行業上下遊的開發者、聯盟夥伴、廠商一同參與,一同受益,生态才會做大,大模型產業才能長久持續。
也只有在前行的路上,不斷摘取「低垂的果實」,完成一個又一個從 0 到 1 的商業化落地,才是新興產業從技術突破到真正落地,從 1 到 100 改變世界的必經之路。