今天小編分享的财經經驗:李彥宏内部發言:「文小言」沒必要像豆包、Kimi一樣激進推廣,歡迎閲讀。
文|周鑫雨
編輯|蘇建勳 楊軒
《智能湧現》獨家獲悉,近日,百度召開 2024 年第三季度總監會,由百度集團創始人、董事長兼首席執行官李彥宏,以及百度内部總監級以上管理人員參加。
第三季度,也被稱為百度的戰略季。在李彥宏近萬字的發言中,AI 仍然是主角。以 AI 為軸心,李彥宏提及了搜索、數字人、智能體、大模型調用、蘿卜快跑等業務的發展戰略。
更重要的是,在 AI 資源緊缺、造血尚早的當下,百度也需要對業務的發展策略進行取舍。比如,李彥宏提到,百度不碰 Sora 類的視頻生成,"10 年、20 年都可能難以商業化應用 "。
他也指出,ToB 業務盡量不碰吃力不讨好的項目制,盡量推出标準化產品。而文心一言改名後的 ToC 新搜索應用 " 文小言 ",在推廣上則不會像字節跳動的豆包、月之暗面的 Kimi 那樣激進。
以下是《智能湧現》對百度 2024 年第三季度總監會李彥宏發言稿的整理和總結:
李彥宏認為,搜索的重構進度是比較慢的,但是他也理解該業務歷史沿革周期較長,員工的觀念難以在短時間内做出調整和轉變。
目前,他認為搜索和大模型的結合,更多應該是在智能體上。在他看來,智能體現在還并不是一個行業的共識,只是百度下的一個賭注," 我們會認為智能體未來會是内容、服務、信息的新載體,甚至是主要的載體。"
但基于這樣的假設,李彥宏認為,智能體跟之前的視頻流或者圖文流内容生态,都會面臨同樣的問題:你怎麼把它分發出去?
問題的解法,在他看來,搜索還是一個主要通道," 因為智能體的形态對話流。如果是靠上下滑動的操作,是沒有辦法跟智能體去做結合和互動的。"
對于智能體的發展趨勢,李彥宏判斷,随着基礎模型越來越強大,智能體的門檻會越來越低;但與此同時,智能體也可以把天花板拉得非常高,因為智能體的自我反思、進化、工具的使用等技術,都還非常早期,以及多智能體的群體協作,目前在產業上還沒有看到實際的落地。
因此,李彥宏認為,若是深入到各個場景中去研判,智能體能構建的東西還很多,想象力仍然存在。
他還提到,智能體已經初步驗證了商業價值," 今天我們有幾十萬家廣告主,已經有上萬家在嘗試接入商業智能體,讓它的廣告效果更好、轉化率更好,然後更好地去觸達和溝通這些目标客户,并且是願意真金白銀地付費。"
基于對搜索的全新認知,李彥宏認為,搜索的重構和重建應該抽成兩步:
搜推融合:
搜索做任何的改變,不僅要看對搜索場景下核心業務指标的影響,也要看對 Feed 這個核心業務指标的影響。
空框推薦(比如百度搜索框中會預置一些詞和句子)的本質是一種推薦,因為這個詞不是由用户來 Input 的,只有用推薦的理念來做才是正解。
AI 要和移動生态結合:
AI 需要跟移動生态做進一步融合,比如影像用户界面和自然語言界面怎麼結合會更自然,這會是未來搜索發展的一個範式。
在李彥宏看來,PC 和移動互聯網時代的主流互動形式,是真人和真人的互動,代表產品是微信。
" 我們現在很難想象虛拟人和虛拟人之間的互動有什麼實際價值 ",李彥宏提到," 所以我覺得價值還是落在真人和虛拟人的互動。"
但他也坦言,真人和虛拟人互動的 Use Case,需要一定的摸索過程,這個過程會伴有陣痛——今年以來,百度就面臨這樣一種陣痛,因為虛拟人的效果開始沒有那麼好,此時往上強推,對用户體驗是一種損害。
不過,李彥宏依然樂觀地認為,技術的進步會倒逼產品的提升,未來虛拟人和真人之間的互動體驗,甚至會超過真人和真人之間的互動。
具體到虛拟人的落地場景,李彥宏提到了直播。他認為,今年的電商直播是很主流的一個產品形态,他會思考董宇輝、辛巴這樣的大 V 的特點和能力,能不能被數字人所復制," 這裏面還是有一點想象空間的 "。
李彥宏舉了一個可以跑通的場景:百度電商直播有很大一部分已經是數字人直播,腳本完全由 AI 生成。現實中,有很多冗長的數據,真人主播不一定能完全記住,但是數字人在記憶上完全沒有問題,甚至比真人更好。
除了 AI 腳本生成,李彥宏認為互動是另一個比較重要的場景,哪怕這一塊對數字人來説還有難度。
在虛拟人上,李彥宏還看到了更多的產品形态。除了直播外,還有視頻。他提到,數字人直播應該對标視頻中的真人能力,而不是直播中的真人能力,因為數字人從理論上來講,應該經過了大量的訓練和打磨,就好比很多高質量的主流視頻,也經過了一遍遍的打磨和重拍。
李彥宏認為,數字人直播和智能體是同根同源的,因為數字人直播有自己的知識庫,和 workflow 這些基本要素。當智能體和多模态兩塊技術相結合,可能就是未來數字人的演進方向。
他提到,百度自 2023 年 Q4 起開始重視智能體的技術發展,今年智能體領網域越來越火熱。他觀察到,OpenAI 發布的 o1 模型是基于強化學習打造的,代表了 OpenAI 對智能體的期待,代表了訓練範式從 Transformer 回歸到強化學習,意味着需要設計很好的獎勵模型。
目前對 Scaling Law 的質疑聲越來越多,但李彥宏認為,中國市場環境中其實很多有價值的數據還沒有被真正應用于訓練,比如直播相關的數據和多模态數據。
在他看來,強化學習和 Scaling Law 一樣面臨着算力和數據的瓶頸,未來更多訓練數據會靠合成數據來補充,而且是要靠對技術或者場景的具體理解來合成。
李彥宏判斷,未來智能體能大幅提高人類的工作效率,但要釋放智能體的潛力,還需要很多技巧。2023 年 3 月,李彥宏曾提到 50% 的人類工作,到最後還是提示詞工程。如今,他還是持相同的觀點。打磨提示詞,是釋放智能體潛力的其中一個技巧。
再者,李彥宏提到,智能體上下文的語境中有個很重要的概念,叫 " 工作流 "。工作流簡單來講就是 " 套路 ",如果能把套路拆解清楚,那它就成了工作流,未來 AI 和機器就能把它自動化。
" 今天世界上大部分方法論,其實還沒有被數字化。" 李彥宏認為,其中還有很大的價值釋放。
李彥宏提到,現在大模型的調用有一些新的共識,比如通過大模型蒸餾出的小模型,在小模型當中是很有競争力的,會比從頭開始訓的小模型能力更強。
當下,李彥宏比較重視 API 的調用量,因為調用量越大,反饋越多,就能去提升基礎模型的能力,也代表市場對百度基礎模型能力的認可。
同時,李彥宏也提到了一些非共識的判斷:
API 的調用質量比數據更重要。如果只強調調用數量的話,很容易引起作弊;
大模型的效果整體還是優于調優過後的小模型。如果對響應速度和推理成本要求很高,可能更适合使用調優後的小模型;但對時間不敏感,想要效果好,還是用大模型。
他也強調,AGI 是百度的長期目标。李彥宏認為,AGI 不可能是半年、一年内就能實現的。
因此在發展過程中,百度需要有所取舍。李彥宏提到,短期内大模型還是要為場景去做優化,他也不追求一個統一的、通用的、在排行榜上能測出來第幾名的大模型,而是想看看在應用場景中,百度的模型是不是超越了競品,是不是真正實現了比真人做的東西更好、效率更高。
關于團隊組織形式,他認為百度要内外部的協同,比如共享研發資源,共同承擔研發成本,而且要确定在百度選定的核心場景中去領先,而不是追求一個完全通用和強大的版本。
李彥宏認為,蘿卜快跑已經走在了世界的前列。
他提到,所謂的 L4 的技術路線一直都有争論:一條是所謂的特斯拉堅持的端到端純視覺,另一條是基于規則的路線。在他看來,兩條路線各有各的道理,主要看誰先跑出 L4。
比如,今天特斯拉的方案,能不能在武漢實現完全無人化駕駛,或者兩到三年後能不能超越分層的端到端。李彥宏認為,二三十年後是可以實現的,但是拐點在哪裏,決定了百度現在采用什麼技術路線去解決這個問題。
針對 2024 年 7 月蘿卜快跑代替人類司機的話題,李彥宏也分享了兩點思考:
歷史上的工業革命其實都是在颠覆底層最辛苦的工作,同時也創造了一些更舒适、更優雅的工作。比如説今天沒有人抬轎子了,也沒有馬夫了。
李彥宏認為,搞創新就是要去替代那些最辛苦的工作,讓勞動力轉移到更不辛苦的工作上去。技術的進步,總體來説還是比較積極的。
人工智能時代,甚至是 AI 和大模型帶來的機遇中,應該也包含着組織創新和流程創新的機遇。
李彥宏認為,數據飛輪是 AI 原生應用成功的充分必要條件,但這其中還有很多大家想不清楚的東西:
比如數據飛輪應該是基于特定領網域的 know-how 或者數據來做的,但業務流程是不是真的在不斷生產這個領網域的知識和數據?這件事情你是不是有意識地去做?李彥宏認為,這方面的行業意識還沒那麼強。
同時,他認為數據飛輪越簡單越好。因為節點越多,轉起來越慢、越復雜,每個飛輪的規模也不大。所以李彥宏希望設計的少就是多,簡單就是復雜。
李彥宏認為,目前百度的資源主要聚焦在讓長板更長。至于補短板的時間點,就是當不補短板,長板就成不了的時候。
在他看來,目前百度的資源分配重點有以下幾塊:
基礎模型至少要在中國領先同行半代。百度會繼續保持對基礎模型的投入;
在重點場景上要超過競品,要能為業務和產品創造價值,而不是毫無差别地去提升基礎模型的通用能力;
在新一輪的組織調整中,HCG(健康事業群組)并入了 MEG(移動生态事業群),這樣整體效率會更高;
内容生态要建設得足夠穩固和有特色,才能做成很多其他工作。比如智能體可以説是 " 詩和遠方 ",但眼下還是要做好用户心智,讓創作者知道來百度創作或者提交内容有什麼好處,或者讓用户感知到在百度上可以看到什麼樣的内容,或者百度擅長什麼樣的内容。
其中,李彥宏特别提到了對于 ACG(智能雲事業群組)的規劃:
首先,ToB 業務一定要标品化。标品化對應的就是項目制,項目制有很多需求,需要派很多駐場人員,要有很多的後台研發改造。
像 Comate 這樣的标準化產品,雖然現在還賣不了多少錢,不夠有競争力,但李彥宏覺得沒關系,這種產品的起點比較低也是可以包容的,因為只要持續的投入,把它的門檻提高,拉大跟競品的差距,未來還是一個好的方向。
其次,ACG 要聚焦中腰部的客户。李彥宏認為,那些可以作為标杆的特大客户,很多時候從他們身上賺不到什麼錢;特别長尾的也不好做——因為手上沒什麼錢。
最後,李彥宏提到了戰略取舍,也是對總監會内容的一個總結。首先是四個 " 取 ":
繼續堅持投入下一代模型的訓練中;
繼續打造智能體的生态,雖然這還不是產業的共識;
以 API 調用為牽引來發展智能雲;
蘿卜快跑要繼續擴大規模。
最後是三點 " 舍 ":
Sora 這種視頻生成的投入周期太長了,10 年、20 年都可能拿不到業務收益,那麼無論多麼火爆,百度都不去做;
New App" 文小言 " 的推廣沒必要像豆包、Kimi 那樣激進;
項目制能不碰就别碰,如果要碰,就得安全地掙到錢。