今天小編分享的教育經驗:中國工程院院士王堅(演講實錄):AI+重點不是加什麼,而是怎麼加,歡迎閲讀。
作者 | 沐風
來源 | 創頭條,管理智慧
咨詢合作 | 13699120588
9 月 5 日,中國工程院院士、之江實驗室主任、阿裏雲創始人王堅在 2024 Inclusion · 外灘大會上分享了自己對 AI、AI+ 和 AI 基礎設施的思考。他提出,AI+ 不是 AI 和產業的簡單結合,而是數據、模型和算力的組合。
王堅表示,當我們講 " 人工智能 +" 的 "+" 時,不是加什麼東西,而是怎麼加,更重要的是一個機制創新。這個創新就是數據、模型和算力的組合。當數據、模型、算力的規模都有了巨大的變化,這時就一定要引入新的東西,那就是 AI 的基礎設施。
王堅説,一個事情要談到基礎設施的時候,就是一個技術滲透的終結的形式。什麼技術會對人類產生最長遠的影響?就是它變成了基礎設施。他援引紅杉資本的觀點,在雲時代、移動時代、AI 時代,基礎設施就是雲計算。
最後他總結," 當你看 AI、AI+、AI 基礎設施的時候,就會發現,這個世界不但技術在革命,機制和基礎設施也在革命。沒有比這三項革命在同一時間發生再令人激動了。我想這些革命正在創造未來。"
AI 的歷史起點
各位來賓,非常感謝有這麼次機會,也算是把過去幾年甚至幾十年有關的一些想法、一些教訓或者一些經驗在這跟大家分享一下。今天我自己找了三個關鍵詞,就是AI、AI+ 跟 AI 基礎設施。其實這三個關鍵詞都有,繞不開一個詞叫 AI。其實這是一個剛才 Michael 也講了,其實 AI 這個詞可能一千個人有一千個人的理解,一千人有一千人的想法。但是今天碰巧這三個不同的方面,就是 AI、AI+ 跟 AI 基礎設施在今天被結合在一起了。
第一個還是我經常説的一句話,我説人工智能有很長的過去,只有非常短的歷史。其實這是一個非常糾結的一件事情。事實上我覺得最困惑的就是到今天為止,其實人工智能到底他在説什麼事情呢?還是值得探讨一下。
這是我想用一張圖,當時我看到以後可能一個最好的反應,為什麼讓我會想起人工智能有一個很長的過去,只有很短的歷史。你今天看到那個紅線畫的地方,就是大概在 40 年代末 50 年代初,就是圖靈寫了篇文章叫 intelligent machines,大概這麼一篇文章。我自己覺得這是一個很長過去的一個開始,如果你要追關于機器智能的事情,可能可以追到幾百年以前。在圖靈這篇文章裏邊,他談了一些很有意思的事情。這篇文章 50 年代發表的時候,是發表在心理學一個哲學的雜志上。第一次在探讨關于機器跟智能之間的關系。
大家要知道在那個時候,其實計算機這個詞還沒有完全出來。所以那個時候大家還習慣把它叫做 computing machinery。這就是為什麼美國計算機學會會叫 ACM,也是這個原因。事實上那個時候計算機沒有詞,但是圖靈在那篇文章也是第一次用了數字計算機這個詞。所以這篇文章它的深遠的意義還是到今天為止看,都是非常值得重新來思考。
就是我們很多最早的概念可能都是從這邊來的。當然這個就是大家都會講到達特茅斯這個會,我自己很有意思,剛才 Michael 特别講到了 cybernetics,我聽完以後我就很感觸,如果當年那個會不在達特茅斯開,可能這十個人的想法就被 winner 給滅掉了。那可能我們今天還是在講的叫 sap metics 來稱呼我們今天説的人工智能。但事實上説不定從單詞角度可能用 sub letice 可能會更好一點,但人工智能就這麼流行了。
那為什麼在 substitute 這邊我打了一個紅的框呢?就是來設想我自己對人工智能的理解。就是從赫爾伯沙蒙開始的,所以這個人很神奇,他是個心理學家,但是去參與了這個會得了諾貝爾經濟學獎。他第一次訪問中國是 1972 年,是以美國計算機學會的名義到中國來的。他 80 年代初又以美國心理學會的名義到了中國來。所以那時候我在大學讀三年級,他到我們去講了關于人工智能。
所以大家可以設想一下看一個大學三年級的學生在中國,在 80 年代初有一人告訴你,人工智能在下面十年會有一次天翻地覆的變化。你大概可以設想一下,那時我都有多麼的激動,對吧?但事實上等了十年沒有什麼東西發生,所以後來就該幹什麼,是吧?但事實上裏邊的很多最基礎的東西在那個時候也被提到了。
甚至大家今天知道的神經網,我印象很深。當時在 80 年代末的時候,有一本教科書叫 PDP 是吧?就 pero distributed processing 那裏面講的通篇都是神經網絡的理論。只不過在今天,那時候講的都是每一層兩個節點,只有三層,大概你能做到那個程度就結束了。但今天的規模跟那個時候沒法比。
所以我想説的一件事情,今天的人工智能跟 80 年代初大家講的同一個人工智能,是一個完全不同的人工智能。我剛才講我覺得 Michael 剛才也講到了這一點。那為什麼算是一個非常短的過去呢,非常短的歷史?如果你看再回到剛才這張圖上,現在這個紅線裏邊就講到了 2017 年,就是 google 開始提出了 transformer 這件事情。
所以我想今天我們能夠談,今天人工智能又重新回到了大家的視野,又重新在產業上有大家影響的話,那就是從 2017 年開始。所以我相信就是這一條 2017 年以前的人工智能跟我們今天説的人工智能,還是有非常不同的差别的那我想這就是我説只有七年歷史的這個原因。當然這段歷史就是從一篇文章開始的,這個大家都知道。但是我想強調一下的事情就是,這文章的這個八個作者現在都不在谷歌。那聽説有一個最近大概又會回去。
AI+ 與行業融合的思考
Anyway 也就是説盡管他發明了很多東西,但是沒有谷歌什麼事。那這裏邊有些發明今天大家被忽視掉的。比如説他第一次有了 token 這個概念,那聽起來好像也沒什麼了不起。大家都知道今天一個商業服務,大家都是用 token 來計價的。大家可以設想一下看,如果你連最基本計價的邏輯都不清楚的話,大概是不會有一個好好的產業的。更不用講待會我這個主題裏面會講到的關于基礎設施的事情。
同樣,大家都知道在谷歌那個時候的前後,就是發表這文章的前後,我們就有一家公司叫 OpenAI。這個 OpenAI 的出現,站在我的角度就是讓我們重新思考一下創新的機制是什麼。所以這就有了在 2022 年這個 GPT 的發布。這兩件事情結合在一起,我總是覺得一件很怪的事情。所以我説了一句話就是谷歌很行,谷歌也很不行。
這個谷歌很行是什麼呢?特别是在中國,大家都會講 0 到 1 的創新。所以大家可以設想一下看,谷歌是 100% 的完成了我們講的 0 到 1 的創新是吧?甚至還要多一點。
但為什麼谷歌不行呢?我覺得大家都可能知道這個 AXI made 在在前段時間有在 stanford 個發言對吧?搞得沸沸揚揚的,就是説的谷歌非常不行,對吧?那确實也不行,為什麼呢?他沒有創造出一個東西,像 OpenAI 創造出那麼的有價值,對社會。
所以我想這中間事實上要讓我們重新思考這個創新的機制到底是什麼。它不是一個簡單的從 0 到 1 創新,不是簡單的你有一個好的想法。這中間的機制是遠遠超出我覺得在今天學者甚至產業界可以來理解的。這也是我覺得對我們一個最大的挑戰。所以我用了一個谷歌很行,谷歌也很不行。
但在這個 chatGPT 後面,它的光芒事實上對大眾而言不是對業界而言,是被掩蓋了很多事情。但大家都知道有 alphafood,對吧?特别是 alphafood3 出來了。
但是很少人會談論説他其實背後還是 transformer 加 diffusion。可能今天大家在講這個能生成一個圖片,能生成一些大家覺得視覺上可以滿足大家生成的視頻。大家會講到 transformer 加 division,可是很少人理解,其實為什麼谷歌那篇文章有那 but fundamental。也就是説到最後大家今天聽到的一些最基本的東西,到最後也離不開 transform 當然就是説從 alphafood 2 到 alphafood 3,事實上他那個名字稍微做了一些改變?所以在 alphafood3 時候,他就用那個 payer 但大家都知道背後最基本的東西還是這個 transformer。
再往下看,其實大家也知道,其實從 ChatGPT 到 alphafood,到今天大家在媒體上也經常會看到關于天氣預報的時候,這是一個三個非常跨度非常大的應用。但是他們到背後,我覺得有一個最基本的東西就是脱離不掉,就是 transformer。所以我想這個 AI 為什麼只有七年歷史?
大家再回過頭來看,我們事實上是你願意不願意我們生活在 transformer 這樣的一個陰影下,也可能是一個以後是一個陽光燦爛的東西。所以我有時候會講到説,當你在這樣的一個背景下,再回過頭來,去年在政府工作報告當中,多次談到了人工智能,同時提到了這個人工智能 +。所以大家設想一下看,在 transform 這個邏輯下,我們要理解的人工智能家到底是什麼。所以大家可能今天一談到人工智能 + 的時候,就會簡單的我加一個行業進去。其實這是我用我自己的話來講,沒有比在人工智能加後面加一個行業把人工智能庸俗化的做法了。所以就是反復思考的人工智能家到底是什麼?所以我們再來看這個 GPT,或者是我們今天要説的這些事情的話,那可能是需要有一次重新的思考的。所以這個 ChatGPT 如果在人工智能加這個邏輯上,大家可以認真想一下看 ChatGPT 不是個應用,它是個應用平台。
AI 基礎設施的興起
就像在上一個年代這個 office 一樣,它不是一個應用,它是應用平台。但如果把 GPT 再拆一拆,剛才講過了,它如果把它變成個基礎模型的話,事實上 chat 就是一個應用。所以 ChatGPT 就是 GPT 加 chat,這是我的理解。
但是我想多説一句的話,chat 不是一個簡單的應用場景。大家都知道 microsoft 跟 OpenAI 這個合作中過程當中,不只是做了 ChatGPT。其實他們到 bill 家裏讨論了很多 GPT 這樣東西可以用到什麼場景。最後只有 ChatGPT 是最革命的,所以變成了產品。他們做了一大堆也很有用,但沒有革命的東西,後來都寫成了書。所以有時候經常開玩笑説這個書是很危險的,就是不是革命的東西都寫成了書,可能最革命的東西做成了產品,這是我們今天真正發生的發生的事情。
我想所以我想沒有比 OpenAI 的這個公司的人對 chat 本身有更深的了解。所以今天我還是要講一句話,就是説當你做不出一個比 ChatGPT 好的這樣的一個東西的時候,是有兩至少有兩個原因在約束你。第一個當然是你的技術也會做好,就是基礎,就是模型。第二就是你對這個問題理解的深度,你能不能真正找到這個領網域的問題,事實上是你約束的最大的一個前提。我們往往在很多時候,其實對這個問題不理解,以為有了 GPT 就可以解決很多的問題。當然我今天講的重點是這個 + 到底是什麼?這個家就讓我想到了大家都知道當時這個 chat 做這件事情的時候,事實上只是反映了當年的一個願景,就是讓計算機能聽能能説。所以我想今天因為有了 ChatGPT 以後,就當這台計算機變成了一個手機以後,我們今天就做到了這一點。
那麼這背後的真正的加的機制就是 ChatGPT。當我們講那個加的時候,不是加什麼東西,而是怎麼加,更加重要的是一個機制的創新。這句話聽起來很抽象,再把它回過頭來,大家可以看一看 ChatGPT 什麼意思,這個家就是 OpenAI 這家公司。沒有 OpenAI 這家公司,GPT 和 chat 是不會變成這樣一個影響大家的產品。
OpenAI 與創新機制的變革
那 openAI 這家公司為什麼是一個機制的創新呢?到今天為止,其實大家都知道 OpenAI 是一個怪物,也就是説它有 nonprofit 的 AI OpenAI,也有 OpenAI LP 這樣加東西。所以大家可以設想一下看,一個 noprofit 一個機構跟一個商業機構在 OpenAI 這麼一個主體裏邊,被這樣莫名其妙的存在在一起。所以我想就是發生的過去發生的事情都跟 OpenAI,其實大家講的 OpenAI 都是講的 OpenAI op。可是當大家知道他的最早的創辦是一個非盈利機構的話,大家可以想象它中間的機制是多麼復雜的一件事情。所以我經常跟投資人講,你用傳統的方法是投不出 openAI 這樣一家公司來。
當然因為這樣的成功,讓我們重新反思了一下。就是傑森黃説了一句話叫 ChatGPT 是人工智能的 iphone 時刻。其實這句話被很多人引用,我自己一開始聽的時候也很激動。但是後來想了一想,這個就不知道在説什麼,為什麼呢?因為 ChatGPT 是什麼也沒有完全説清楚,完了人工智能是什麼也沒有完全説清楚,那 iphone 到底是什麼也沒有説清楚,就是把這三個説不清楚的東西放在那裏變成了一句話,這是讓我困惑了很長時間。
其實大家也不要覺得他説清楚 iphone 是什麼是一件很困難的事情。我説一個現象就知道了。大家説起這個 iphone 都覺得 apple store 是它非常重要的事情。今天任何一個人發言都説生态多麼重要,可是很少人理解。你們去看第一個,Steve Jobs 發布第一代的 iphone 時候,是沒有 APP store。完了如果你要講它的生态系統,當年跟 Steve jobs 一起發布 iphone 第一代的那些公司,今天都不見了。所以他到底是什麼?也是值得我們非常深思的。
當然這句話我自己覺得他其實抄襲了另外一句話。這是當年我自己聽看了非常激動的。就是當 alphafood 出來的時候,alphafood 2 出來的時候,有人説了一句話,大家説是 alphafood 是生物學的 image net 時刻。我自己覺得這個是真正反映了技術發展的背後的。
當然這個就回到了那篇也是那篇文章,就是 jeff hinton 跟他的兩個同學兩個學生寫的。這篇文章大家知道在在做,至少在做機器學習也好,影像識别也好,一定知道這篇文章。但你把這篇文章抽象出來,它就三個東西,就是我們今天構成我們人工智能。大家天天在講三個東西,就是 imagine net,就是有組織的這個數據。完了它有一個模型,那時候叫 CNN,完了加 GPU。這是第一次一篇文章完美的把三個東西結合在一起。只不過是這三個東西在那個時候都談不上是新的,image net 也存在了很久,CEN 也不是一個新的算法,GPU 那個時候在每個網吧裏面都有。
但是是這篇文章,這三個學生呢把它結合在一起,使得 GPU 模型和數據成為做這個行業的一個最基本的标準。特别是 GPU 是在那篇文章之後,他才成為學術界的标準,在他這篇文章之後才成為工業界的标準。而當時他們用了兩塊 GPU 卡,是一個非常普通的 GPU 的卡。盡管這兩張 GPU 的卡在當時大概已經超過了上萬個 CPU 核的算力,但是現這是在中國的每一個網吧裏面都有的 GPU 卡。但是因為這樣發生了一次非常大的變化,所以算力重不重要?算力重要。但是在創新階段,大家都知道沒有比人的創造力再重要的事情。那麼到了今天發生的變化,為什麼會引出要引出基礎設施呢?就是因為規模。
也就是説當數據模型算力的規模都變成了一個巨大的變化的時候,這個時候一定要引入了新的東西,不然它沒法解決了。這個也是做 IT 做程式設計的,看到這句話也很激動。這是 Pascal 的發明人曾經寫過一句話,他説一個嬰兒的速度的 1000 倍就是一架噴氣機。也就是説在我們世界裏面,任何的事情的規模增加了 1000 倍,它就會發生天翻地覆的變化。大家都知道在我剛才講的三個組合的規模上,在每一個單元都超過了 1000 倍。正是這 1000 倍,使得今天我們繞不開一個最基本的東西,就是 AI 的基礎設施。
大家知道一旦有一個事情要談到基礎設施的時候,我覺得這是一個技術滲透的終極的形式。大家可以理解,你看人類發展歷史上任何技術的發展,什麼技術會對人類產生最長遠的影響,就是它變成了基礎設施。當然是 AI 基礎設施不是我發明的,今天大家都在談的。所以我想為什麼從 AI 到 AI+ 到我們今天可以講 AI 基礎設施的話?是一個非常值得我們深思的那下面我很快時間也會很快説一下,這是紅杉在一個在在一次研讨會上用的一個 slide。把它拿過來了。拿過來的目的,只是為了看大家最下面一行,他就會叫做基礎設施。
AI 時代的雲計算
大家看一看在雲時代,在移動時代,在 AI 時代,他們覺得的基礎設施就是雲計算。這裏很有意思,他把蘋果是劃到了基礎設施這一類的。同樣的大家可以看到在今天,他把英偉達也劃到了基礎設施那一類。所以這是一個非常有意思的一個分類方法。這個也不奇怪,為什麼?因為大家都覺得他應該去做雲計算。
作為做雲計算的我看到這張圖的時候也非常激動。這張圖不是我畫的,但是看到之前在解釋是我的解釋。就是這張圖大家看到這是六個在美國的做 AI 的獨角獸,那你看它背後的基礎設施的支持很有意思,就是 openAI,大家都知道它背後的他得到了 100 億美金的投資,它背後是 microsoft,第二名的背後是 AWS。大家可以看到在這些企業真正背後的排名是什麼?就是全世界排名第一、第二第三第五第六的雲計算服務商,都是今天每美國獨角獸公司的背後支撐的來源。
這裏當然大家看到很很神奇的一件事情,在這裏有第一第二第三第五第六,就是沒有第四,對吧?那第四就是阿裏雲。這個就從我想就是説這種基礎設施對将來這些事情的影響的話,從計算這個角度也能看得出來。但是我想從另外的角度也反映了這個產業之間的差距到底在哪裏。所以從這個角度讓我想起了另外一句話,我覺得微軟很不行,但是微軟也很行。也就是説它在人工智能他沒有做出 transform 這樣東西。但是他因為雲,因為這個基礎設施,他在跟 OpenAI 創造出這麼一個今天我們可以看到的東西出來的話。那我是覺得你從另外一個角度也可以看得出,好像微軟不行,但是微軟還是很行。
所以我想在 AI、AI+ 跟 AI 基礎設施這個邏輯上,所有人都是可以做自己可以創造歷史的事情。我前幾天看到一個創業公司,為了證明他這個創業的重要性,畫了一張圖。我覺得很有意思。就是我相信今天我們老師講數據,講計算,講算法。但是大家設想一下,這些東西不在一個基礎設施裏邊,事實上是沒有價值的。所以大家我把這個紅框裏面畫出來,其實這樣很有意思的告訴大家是數據是基礎設施的核心的組成部分。數據不只是一個模型的附屬品,這個數據也不只是一個計算的附屬品。只有這所有這些東西變成一個完整的基礎設施的時候,我們才會有那一次更加激動人心的創新。
如果大家看最前面它裏面講到那個事情,去做了兩個區分,他就講是在在傳統的 IT 時代的雲計算,以及他説在 AI 時代的雲計算。盡管這兩種計算有差别,但都是雲計算。同樣他數據也做了這個區分,就是在傳統意義上的數據跟在 AI 這個意義上的數據,它是做了這麼一個細微的區分的。因為今天這個我就不展開講了。
最後總結一下,就是事實上當你看 AI、AI+ 跟 AI 基礎設施的時候,你就會發現這個世界不但技術在革命,機制也在革命,基礎設施也在革命。沒有比這三項革命在同一個時間發生令人激動了。所以我想這些革命正在創造未來,謝謝大家。
華夏基石數智時代領導力特訓營熱招中!
開班時間