今天小編分享的互聯網經驗:李彥宏:沒有應用,AI模型一文不值,歡迎閲讀。
7 月 4 日周四,2024 年世界人工智能大會(WAIC 2024)在上海正式開幕。本屆大會以 " 以共商促共享,以善治促善智 " 為主題,将聚焦全球人工智能領網域的前沿技術和創新應用,致力于展示人工智能如何改變世界、塑造未來。
下午 13:30 開始的產業發展主論壇上,百度創始人、董事長兼 CEO 李彥宏出席發表主題演講。本文整理出核心觀點如下:
1、同樣參數規模之下,閉源模型的能力比開源模型要更好。當你處在一個激烈競争的市場環境當中的時候,你需要使讓自己的業務的效率比你的同行更高、成本比你的同行更低,這個時候,商業化的閉源模型是最能打的。
2、沒有應用,光有一個基礎模型,不管是開源還是閉源,一文不值。所以我從去年下半年開始講,大家不要卷模型了,要去卷應用。
3、文心大模型的日調用量最近超過了 5 億,代表了真實的需求,説明有人在用、是有人真的從大模型當中獲益了,并得到了價值。
4、超級能幹的應用比只看 DAU 的超級應用恐怕要更重要,只要對產業、對應用場景能產生大的增益,整體的價值就比移動互聯網要大多了。
5、随着基礎模型的日益強大,開發應用也越來越簡單了,最簡單的就是智能體,這也是我們最看好的 AI 應用的發展方向。
6、AI 不是人類的競争對手,更多的是在扮演副駕的角色,還要人來把關。目前,AI 已經創造了一些全新的工作機會。
以下是李彥宏演講的主要内容:
各位下午好,非常高興再次來到上海參加世界人工智能大會。我是這個會議的常客,但是去年因為出國沒有來,所以我上一次來參加 WAIC 是 2022 年,我記得當時大會的主題是元宇宙,我當時講的主題是 AIGC, 就是 AI Generated Content(生成式人工智能),我認為 AI 的技術發展路線發生了方向性的改變,就是從過去的辨别式人工智能轉向了未來的生成式人工智能。
這番話當時發表于 2022 年的夏天,五個月之後,大家都知道,ChatGPT 發布了。
後來的事情大家就更清楚,所以兩年的時間其實恍若隔世,就是感覺整個世界都變了,人工智能可以説颠覆了絕大多數人的認知。
商業化的閉源模型 " 最能打 "
2023 年國内出現了百魔大戰,造成了社會資源的巨大浪費,尤其是算力的浪費,但是也使得我們追趕世界上最先進的基礎模型的能力得到了建立。去年 10 月我宣布文心 4.0 發布的時候,我説文心 4.0 的能力跟 GPT-4 相比毫不遜色,好多的同行還不以為然。
今天大家可以看到,國内已經有多款閉源模型聲稱他們已經追平或者是超越了 GPT-4 的水平。注意,我這裏説的是閉源大模型,不是開源大模型。
這也是今年以來就是争議比較多的一個話題,有些個外行甚至混淆了模型開源和代碼開源這兩個概念。模型開源你拿到的是一大堆的參數,你還是要去做 SFT,還是要去做安全對齊,你不知道這些參數是怎麼來的,你是無法做到 " 眾人拾柴火焰高 " 的,即使你拿到對應的源代碼,你也不知道他用了多少數據,用了什麼比例的數據去訓練這些個參數,所以拿到這些東西并不能夠讓你站在巨人的肩膀上去迭代和開發。
所以同樣參數規模之下,閉源模型的能力就比開源模型要更好。而如果開源想要能力追平閉源,那麼它就需要有更大的參數,這就意味着推理成本會更高,反應速度會更慢。
很多人拿開源模型來改款,以為這樣可以更好地服務自己的個性化的應用,殊不知這樣你就創造了一個孤本的模型,既無法從基礎模型的持續更新當中獲益,也沒辦法跟别人去共享算力。
當然我也承認開源模型在某些場景下是有它的價值的,比如説一些學術研究,或者説在教學領網域,大家想要研究大模型的工作機制形成理論,這個時候可能是有價值的。
因為大家可能也經常聽到,就是我們覺得大模型能力很強,但是不知道為什麼能力強,因為背後沒有理論來支持他,所以研究領網域用開源的我覺得沒問題,但是大多數的應用場景開源模型并不合适。
當你處在一個激烈競争的市場環境當中的時候,你需要使讓自己的業務的效率比你的同行更高、成本比你的同行更低,這個時候,商業化的閉源模型那是最能打的。
沒有應用,AI 模型一文不值
當然這些都不是最重要的,沒有應用,光有一個基礎模型,不管是開源還是閉源,一文不值。所以我從去年下半年開始講,大家不要卷模型了,要去卷應用。
但是我看到我們的媒體仍然是把主要的關注點放在了基礎模型身上,一天到晚到處去關注跑分、刷榜,誰又超越 GPT-4 了?OpenAI 又出來 GPT-4o 了等等,今天這個震撼發布,明天那個史詩級更新,但是我要問:應用在哪裏?誰從中獲益了?
應用其實離我們并不遙遠,基于基礎模型的應用在各行各業各個領網域都已經開始了逐步的滲透。
兩個多月前,我們宣布文心大模型的日調用量超過了 2 億,最近又超過了 5 億。其實僅僅是兩個多月的時間,調用量發生了這麼大的變化,它背後是代表了真實的需求,是有人在用、是有人真的從大模型當中獲益了,得到了價值。
比如在快遞領網域,讓大模型幫助處理訂單,做到了一張圖、一句話,寄快遞不再需要其他的繁瑣流程,時間從 3 分多鍾縮短到 19 秒,而且 90% 以上的售後問題也都是由大模型來解決,效率提升非常的明顯。
再比如在小説的創作領網域,一開始我們用開源模型做出過一些效果,後來改用文心的輕量級模型,經過 10 輪上萬組數據的 SFT 和 Post-pretraining(後期預訓練),結果有了明顯的提升。
最近,我們又轉到文心 4.0 的版本,那麼僅用了數百條的數據,生成的内容無論是可用率還是優質率,都大大超過了文心的輕量級模型。網文作者們如虎添翼。
超級能幹的應用比只看 DAU 的超級應用更重要
其實更通用的領網域,比如説代碼生成功能,文心、快馬這樣的軟體在各個領網域也在逐步地滲透。
百度内部的話,我們有 30% 左右的代碼已經是用 AI 生成的,代碼的采用率超過了 44%。
不過我們要避免掉入超級應用陷阱,覺得一定要出一個日活用户 10 億的 APP 才叫成功。我認為這是移動時代的思維,AI 時代的規律很可能不是這樣。超級能幹的應用比只看 DAU 的超級應用恐怕要更重要,只要對產業、對應用場景能產生大的增益,整體的價值就比移動互聯網要大多了。
看好智能體的應用發展方向
随着基礎模型的日益強大,開發應用也越來越簡單了,最簡單的就是智能體,這也是我們最看好的 AI 應用的發展方向。
制作一個好的智能體通常并不需要編碼,只要用人話,把這個智能體的工作流説清楚,再配上專有的知識庫,一般就是一個很有價值的智能體了,這比互聯網時代制作一個網頁還要簡單。
未來,在醫療、金融、教育、制造、交通、農業等等領網域,都會依據自己的場景,自己特有的經驗、規則、數據等等做出各種各樣的智能體,将來會有數以百萬量級的智能體出現,形成龐大的智能體生态。
而搜索是智能體分發的最大的入口。剛剛過去的高考季,很多大模型公司熱衷于去寫高考作文:我用 AI 寫一個作文能得多少分兒?其實這個實用價值是不大的,人家不會允許你帶一個大模型進去參加高考。
真正的需求是大量的考生在考完之後要報志願,要選擇學校、選擇專業。他們對一所大學一個專業會有各種各樣的問題,而每一個考生的情況又是不一樣的。這個時候就是需要有一個智能體來回答每一個考生專有的問題。
在高峰時期,百度的高考智能體每天要回答超過 200 萬個考生的問題,而我們總共只有 1000 萬的考生。在一天當中,有這麼大比例的人在利用這個智能體,説明 AI 正在以前所未有的速度向各行各業滲透。
AI 只是輔助,相關工作機會正大量誕生
很多人擔心,如果我們日常的工作都讓 AI 去做了,人是不是就沒有工作機會了?
這種擔心不是沒有道理,但是過去這段時間,我聽到的擔心、聽到的抱怨很多,聽到的建設性的意見比較少,很少有人去致力于發掘生成式 AI 帶來的新的工作機會,我在這兒算是抛磚引玉吧。
我覺得,一方面 AI 更多的是在扮演副駕的角色,還要人來把關,AI 只是輔助人工作,而不是替代人工作,它讓人的工作效率更高,質量更好。另外一方面,我們也看到有一些全新的工作機會開始冒出來了。
比如數據标注師,過去幾年我們幫助全國 20 多個城市落地了數據标注中心,提供了大量的新的就業崗位;再比如提示詞工程師,以後不用編程了,但是做好一個智能體還需要把工作流説清楚,這裏頭要有很強的邏輯性,要用提示詞對模型進行調校。
随着智能體的大量湧現,這種工作需求也會飙升。這些個工作機會通常門檻并不高,你做的一般也能夠養家活口,做得好的話,那上限可以年薪百萬。
自人類文明誕生以來,永不停止的創新,就是刻在我們 DNA 當中的,從石器時代的手斧,到移動時代的手機,再到 AI 時代的大模型,人類不斷創造各種工具來改善生活、提高生產力,但是它們永遠只是工具,只有在被人類所使用的時候才有價值。
我們堅定地相信,AI 不是人類的競争對手,構建和應用人工智能技術是為了滿足人的需求,增強人的能力,讓人類的生活更美好。謝謝。