今天小編分享的科技經驗:為何說AI原生應用是最大機會?李彥宏這場對談說得很清楚,歡迎閱讀。
12 月中旬的周末,北京處在一場持續的寒潮裡。每天的最高溫度在 -5 度以下,積雪變成冰層結在路面上,車輛很少。我出門前問了問文心一言今天該如何出門,它說盡量選地鐵,因為我大概率打不到車。
打車有點晚了。12 月 16 日在 751 的大煙筒旁邊,有一場大模型的創業大會。大模型仍然很熱,聚集了上千名創業者,還有幾十位企業 CEO 來了現場,台下是更多的想找一個跨向 AI 時代的正确姿勢的開發者。李彥宏也去了。
在 ChatGPT 發布一年之後,文心一言更新到了 4.0 版本,它現在在網站和 APP 上叫做文心一言專業版,比起最初的版本,現在它能夠完成一些多模态的任務,在邏輯和推理能力上已然不可同日而語。而這一年時間裡,整個中國大模型的業态也發生了巨大變化,ChatGPT 的驚豔變成一場場躬身入局。到了 12 月的這場降溫裡,我們似乎正在經歷一場大模型過熱。
截止今年 10 月,Hugging Face 上已經有接近 3 萬個文本生成模型可供下載,國内發布的大模型數量已經達到 238 個。6 月份的時候這個數字是 79 個,相當于 4 個月就翻了 3 倍。但人們到現在仍然只記得那不超過 10 個大模型的名字。
一個圍繞大模型的新產業正在形成,但李彥宏發現這個新產業裡大部分人都用錯了力,這讓大模型進入一場資源盲目浪費的怪圈。
更直觀明了的創新路徑,原本應是在模型上開發 AI 原生應用,或者是用模型改造自己的現有產品,這卻在瘋狂燒錢、跑分的大模型熱中被忽視了。應用才是大模型的價值所在,就像我們最初是從 ChatGPT 的驚豔故事裡認識了 OpenAI 和它的大模型,而不是相反,或者從任何榜單跑分上。
李彥宏有些 " 着急 ",關于大家仍然在卷基礎模型,而還沒有開始卷 AI 原生應用這件事。
現在不是大力出奇迹的階段了
這也不是李彥宏所經歷的第一次 AI 浪潮。AlphaGo 在 2016 年左右引發了全世界的關注,随後計算機視覺的火熱又孵化出了一大批新的創業公司。但此前的百度一直保持着定力,飛槳的框架在形成,文心大模型在 2019 年拿出了第一個版本,但百度過去這十幾年從來沒有做過任何和用人工智能來下圍棋有關的事,而對于計算機視覺帶來的人臉識别或者智能巡檢的想象空間,李彥宏又有所保留。
" 即便你能夠下得過全人類的圍棋冠軍,但這件事能產生的價值是很小的。而人臉識别或者智能巡檢這樣的場景又很分散,各種各樣的場景你都要單獨去做一套,一旦場景分散了,就意味着很難有标準化的產品出現。"
圖源:百度
李彥宏從未像這次生成式 AI 的出現一樣興奮。
" 這次大模型技術浪潮,我覺得不一樣之處就在于它的通用性。我們講叫 " 智能湧現 ",沒有教過的它也學會了。有了這個特點之後,當你有一套基礎技術能夠做得非常好、非常領先的時候,它在各種各樣的場景都能夠迅速做出有價值的應用來。這是 AI 過去 70 年從來沒有過的事情,所以它是完全不一樣的機會。"
技術終究是為應用服務的,而花費大量資源來打榜,甚至過分聚焦模型的基礎能力都在某種程度上偏離了這樣的原則。
" 模型技術的先進性與否,更多的要看這個模型在什麼應用場景下,能幹什麼。把這個東西想清楚了之後,才能夠去評判模型的好壞。有時候我覺得模型好壞的評估能力是一個大模型公司的核心競争力。你知道什麼叫好,什麼叫不好,你才能夠做出好的來,如果你都不知道,你要靠第三方給你做評價,給你打個分,這個事兒是不靠譜的,你自己都不知道你在幹啥?"
一篇論文做過統計,美國所有大學的 GPU 數量集結起來,都訓練不出一個 GPT-3.5。OpenAI 用巨大的資源成本完成了生成式 AI 從 0 到 1 的探索,而在一年之後,李彥宏認為對于大部分大模型產業的參與者來說,現在已經過了 " 大力出奇迹 " 的階段了,甚至更多走向它的反面。
" 大模型到最後價值會落在應用上。這跟所有商業競争規律都是一樣的,誰的效率高誰勝出。你可以融資,我也可以融資,最後我用 10 塊錢做出來 100 分的效果,你用 10 塊錢做出來 120 分的效果,久而久之你就赢了。"
這也是百度内部在大模型應用研發時所堅持的一條效率路線,李彥宏拿百度文庫的 PPT 生成能力舉了個例子。
需求從具體場景中出現之後開始向下傳遞,然後文心大模型必須為這個需求去做優化,優化的時候遇到文心大模型調用成本的問題,再倒逼深度學習框架飛槳去配合模型層做調優,甚至需要調整芯片層去适配框架層的調優。這樣一層一層端到端優化下來,現在百度文庫 PPT 生成的推理成本基本上降低到 3 月份文心一言發布時的 1%。
" 從原來一天只敢調用一萬次,到現在敢一天調用 100 萬次,這是完全不一樣的感覺。而我覺得這是未來競争的主線。"
以應用為導向的,都有機會
" 我們需要 100 萬量級的 AI 原生應用,但是不需要 100 個大模型。" 李彥宏在 11 月提出過這樣一個判斷,一個月後這種感覺更強烈了。
PC 時代,基本上只有 Windows 一個作業系統,但是基于 Windows 系統開發的軟體有很多;移動互聯網時代,主流作業系統也只有安卓和 iOS 兩家,而移動應用有 800 萬之多。如果把大模型看作類似作業系統的基礎底座,那這個故事的終局可能只有一兩個名字,以及無數在中途折戟的玩家。
李彥宏認為大模型時代将會延續這樣的特征。人類進入 AI 時代的标志,不是產生很多的大模型,而是 AI 以各種應用為載體自然的進入人類生活。
李彥宏認為發展出好的應用有三個關鍵因素:
相關產業政策來鼓勵基于大模型的 AI 原生應用開發。
現有企業利用大模型來對它的業務核心關鍵指标產生正向作用。
第三是超級應用的出現,但在什麼時候、哪個領網域出現,需要更多創業公司多努力,做各種各樣的嘗試。
就像移動時代誕生了像微信、抖音、Uber 這樣的 "mobile-native" 的應用一樣,AI 原生時代一定會有優秀的 AI 原生應用是基于這些大模型開發出來的。在 ChatGPT 出現一年之後,無論是中國也好,美國也好,最好的 AI 原生應用還沒出現。
而新的殺手級 AI 原生應用可能是一個全新的場景或創意,也可能先從對現有產品的 AI 原生化改造開始,這方面 Adobe 和微軟已經有了值得借鑑的成果。
Midjourney、Stability AI 這樣帶着生成式 AI 的設計工具并沒有讓老牌的 Adobe 式微。後者在今年 10 月拿出了世界上第一個專注于生成矢量圖形的生成式 AI 模型,并且一口氣宣布了 Creative Cloud 的 100 多項重大 AI 創新和更新,從今年 3 月推出 Firefly 影像模型的第一個測試版本到現在,Adobe 的股價在不到一年時間裡從 300 美元的水平起跳,幾乎翻了一倍。
微軟是一個不做大模型的公司,但卻做出了現階段最成功的 AI 原生應用 Copilot,并且已經開始向用戶收費,定價 30 美元一月,比整個 OpenAI 全年的收入要大很多倍。目前微軟的市值已經到了 2.8 萬億,五倍于 OpenAI。
圖源:澎湃新聞
" 大廠會拿走大多數的紅利。" 對于現在仍然無法完全把握的 AI 變革和新的 AI 原生應用的機會,李彥宏有這樣一個判斷。
" 這裡所說的大廠不是單指互聯網大廠,而是現有幾乎所有成型行業自己的大廠,這些當下生產力落後的公司一旦轉過彎來,能夠很好利用大模型能力的話,他們獲得價值增益的總和一定是最大的。"
但這并不代表創業公司沒有機會," 創業公司做出三五個 Super APP 是非常有可能的,做出幾百個幾千個非常有價值垂類的應用也是非常有可能的。"
而在這場尚未被定義的競争中,從前做產品的成功經驗,大廠的光鮮背景或是深厚的技術背景,可能都不是通向那個成功的 AI 原生應用的決定性因素。
" 學習能力是最重要的 ",李彥宏表示。
" 我認為未來真正成功的 AI 原生應用產品經理,很可能不是某一類人,而是各類人的綜合。我見到過的一些比較優秀的人,他學習的專業可能不是計算機科學,但他學習能力往往很強,有產品的感覺,有市場的感覺,同時又不怵技術。這種類型的人是最有可能成為成功的產品經理的。
李彥宏分享了一個他在百度内部對產品經理的看法細節:
" 我有時候會聽到百度的產品經理說,我們現在技術很厲害,我們的技術發展也很快,我一定要把百度最優秀的技術及時用到我的產品當中去。
我說,不行啊,大模型能力迭代太快了,我們現在最優秀的技術也是很不成熟的技術,一個月之後它就已經落後了。
所以產品經理自己要先明确業務需求是什麼,然後去逼着技術團隊把這個需求給我滿足了——一定要給我做出來,你現在沒做出來,OK,但是你要多長時間之内把它做出來,能提這樣要求的 PM 才是合格的 PM。"
用具體的需求去引領看起來 " 全知全能 " 的大模型往更有價值的方向進化,AI 原生應用所有的機會和颠覆性都在這裡。