今天小編分享的教育經驗:韋青:遠取諸物,近取諸身,則近AI之道矣,歡迎閱讀。
"風生于地,起于青萍之末",什麼是這個時代的"青萍之末"?
"我總是滑向冰球即将到達的下一個位置",信息文明時代,哪裡是冰球即将到達的下一個位置?
"過了這個村,就沒這個店了",這真的符合創新的第一性原理嗎?
今天,韋青老師再次講述新人機時代的生存與發展之道,擁抱這個時代的不确定性,賦予智能機器以人類的主觀能動性,在它們的幫助下應對因連接而高度復雜的人類社會。向機器學習,與混沌為伍。
以下為課程筆記:(篇幅所限,文章内容僅為部分課程内容,請前往混沌APP看完整課程)
授課老師丨韋青 工程師、技術官
編輯丨混沌商業研究團隊
支持丨混沌前沿課
青萍之末
亞馬遜雨林中的一只蝴蝶振動一下翅膀,就可能引發美國得克薩斯州的一場龍卷風。然而,當我們看到飓風來臨時,遊戲其實已經結束了。"夫風生于地,起于青萍之末",我們應當構建出根據"青萍之末"判斷"風生"的能力。
嚴格意義上,你可以把這種能力說成是概率性的規律總結,它可以幫助人類察覺很多以往無法察覺的"青萍之末",而這恰恰是機器擅長、人不擅長的。既然是概率性模型就一定會有錯誤,當你接受了世界是不确定的,接受了你永遠會犯錯誤,你只需要關注如何少犯錯誤。把這些思維整合在一起,我們就有可能成為機器的主人。如果人類過分自大,認為自己不犯錯誤,那就會喪失讓機器的算法能力強化我們的機會。狂奔的技術,需要相應的文明與制度的駕馭。無論何種長技,都需要相應的人才發揚光大。
人類社會因連接而復雜。通訊就是這個時代的"青萍之末",5G、6G衛星網絡全部連接之後,這個世界不可避免地會成為地球村,我們的精力、财力、時間都被通訊連接起來。假設有十個人交換意見,如果彼此單點交叉,差不多有九十種可能。如果彼此實時互聯,就有2的90次方種可能。
這種復雜性是不可能被人類個體在沒有外力幫助的前提下自己應對,也不可能單單依靠人類群體的能力解決,我們已經因為技術的進步不知不覺、不以人類意志為轉移地進入了一個确定性因復雜而消失的時代。我們要習慣這種不确定性,與混沌為伍,利用這種現象打造新的可能性,變成一個無限遊戲往下演繹。我們要珍惜彼此間不同意見相碰撞的機會,只有這種碰撞才能打開一個我們都不知道的局面。頭腦、資金、數據、知識,各個領網域的洞見湊到一起,看看未來到底是怎麼回事。
人類社會又因實時連接而失控。信息本身就是模因,它自己也在尋找生存的空間和機會,它會利用人的思想作為模因的載體。原來聯結沒有建立起來的時候,模因的自復制和傳播是短暫的,但由于現在是實時互聯,模因也開始進行突變,可能一下子就傳開了。
從老死不相往來到現在雞犬之聲相聞,就會形成一種流通和共振。這種共振的力量非常強大,如果用好了,就是一個摧枯拉朽的力量。如果用不好,或者被别人利用了,也将是一個毀滅性的力量。這實際上就是網絡效應,因為互聯而形成的一種必然的社會現象。
那麼,我們有沒有準備好應對這種時代?我們要明白,這個時代的信息是"比真還真"的。我們現在看到的絕大多數信息,都是電腦、電視、手機上的像素構成的。當我們還在相信由像素產生的信息時,有沒有考慮過這種像素產生的信息恰恰是機器最容易形成的。如果不理解這一點,什麼都相信的話,實際上是很危險的。
信息就是用來改變人的思想的,如果有信息說服我們說,未來物理世界不復存在,每個人都将生活在虛拟世界裡,而你不加審辨地聽信,那麼人的思想一旦改變,你對物質世界的感知也會變化,這是認知心理學早已證明的。如果我們不具備一定的抵御能力和審辨能力,我們該怎麼去理解這個信息世界?
大家看過很多新聞,誰能夠百分百地确信那些事情是真實發生的?我相信現在還沒有惡劣到那種程度,大概率這些所謂的信息确實發生着,因為還有很多公共媒體的驗證。如果越來越多的媒體使用機器湧現產生的信息,我們如何保證自己能夠不中毒?要如何為自己的思想戴一個N95口罩?
《讓子彈飛》中黃四郎最後能夠被消滅,是因為張麻子把黃四郎的替身給砍頭了,讓鵝城的百姓看到以為黃四郎死了。實際上黃四郎沒死,但他的信息被證明死了,所以他就死了。這就是信息社會的特征。大家要知道,人是多麼容易被其看到的圖景和聽到的故事所欺騙。
這時候還能再靠人腦抵御信息的迅速流轉嗎?這是不可能的。Satya(薩蒂亞·納德拉)常常引用的一句道格拉斯·恩格爾巴特所述:"應對復雜性和緊迫性的能力是衡量人類組織與制度的标準,但是復雜性和緊迫性已經超越了人類可以應付的程度。"我們要用技術手段幫助人類應對這種復雜性的挑戰。人工智能的作用絕不僅是生成文字、圖片或視頻,它可以幫助我們應對信息時代的所有挑戰。
篇幅所限,本文内容僅為課程十分之一
點擊海報,看完整課程!
趨勢:"冰球的下一個位置"
2007年iPhone上市,憤怒的小鳥這款遊戲應該是2008年到2012年之間安裝頭幾位的應用,還有一部為它拍的電影,絕對是一個現象級的產品。十五年前,那些程式員和用戶認為,iPhone或智能手機就是用來玩憤怒的小鳥的,現在這個應用已經沒有人安裝了,但我們會認為手機沒有前途了嗎?手機已經融入到我們生活中的方方面面。
此時此刻此景,地球上的某一處也許會有另一個現象級情況出現,就像憤怒的小鳥一樣,如果錯過了,你會不會覺得就沒有前途了呢?現在我們知道不會,但在那個氛圍下,每個人都想去做憤怒的小鳥和它的衍生品。
喬布斯說:"有一句韋恩·格雷茨基說的話我很喜歡,‘我總是滑向冰球即将到達的下一個位置,而不是它現在的位置’。在蘋果,我們一直努力做到這一點。從一開始就是這樣,未來也一直會這樣"。2007年蘋果發布會結束後,就正式開啟了iPhone時刻。我們是否能對冰球即将到的位置、世界即将到來的時刻有一定的判斷呢?
在科技界有一個曲線叫做"技術炒作(信仰)曲線"。外人沒有從頭經歷過其它行業中早期不為外人道的探索與彷徨,其中也包括很多革命性現象;由于看不到原來發生了什麼,只看到了出水的那一刻,于是認為事情永遠都是這種驚天動地的走勢,"孫猴子突然從石頭中蹦出來",所以就會有紅色箭頭這種方向性的模型預判,這也被戲稱為"吹牛曲線",其實是英文Hype cycle的原意。而行業裡的人有着尚未躍出水面的這段經歷,就會明白黃線是其本質,傾向于做出綠色趨勢的判斷。如果人心、市場或資金出了問題,比如很多資金由于沒有及時止損,砸在裡面了,就變成了藍色的這條趨勢。信息時代你要從"言-行"和"效-果"兩個方面、四個維度來判斷是炒作還是正常,結果是什麼,如果沒什麼結果,就少費點錢,少費點精力。
應對時代我們還是要創新,或者說創變。其實創新從邏輯上來講不夠完備,它講的是從舊到新,中間有個過程沒說。而"變"有一定概率是要失敗的,有很多次失敗才會由新到舊。
什麼是創新(創變)的第一性原理?有的科技樹可以長到200層,很多時候我們都是被直升機直接送到技術樹的一個分杈上,直接到了100層,但是這個分杈可能最高也就101層,這就陷入到了本地最優解。那麼如何破這個局呢?這時候我們就要回到原點,往下走看看這顆樹到底怎麼長的。就像爬山一樣,走着走着發現沒路了,為了達到更高的地方,還得再下山,找别的路上山,因為可能性越往根部越大。
回到原點後又開始了人類新一輪的信息文明,可能需要花幾百年,才對當初用智能機器解脫人類負擔的願景有一個初步的交代。再往下走可能還是會走偏,走不到全局最優解,沒關系,随時糾錯,再退回來一點,找到全局最優解。
這是一個循環迭代的過程。比方現在這一輪大語言模型,如果還是靠堆算例、堆數據,大概率到了一個平台期,但不是說它沒有前途了,而是要重新回到人類的訴求上,再來一遍。用這種想法來看,絕對不存在"過了這個村就沒這個店了"的道理。如果你願意回到樹根,就一定能長出新的杈來。
那麼,我們有沒有這樣的技術信心和技術信仰?我所知道的OpenAI、微軟、谷歌、蘋果、Facebook、華為、聯想、阿裡、騰訊、百度、京東等等這些公司,一定都是有技術信仰的。成功除了有能力以外,堅持也很重要,堅持源自信心,信心源自信仰。如果這個信仰很輕易地就被動搖了,那麼失敗就是大概率事件。
落 地
微軟對自己的定位是生產力和平台公司。原來是以Windows為平台,現在是指智能雲平台。生產力就是減輕人的負擔,幫助人更高效地幹活。因此,對于微軟來講,如果不解決生產力的問題,是沒有人會投入資源去做產品開發的。去年二月,微軟推出了和Bing結合的GPT服務。雖然說有了新的寶刀,但大家卻沒有被這個工具迷惑住,工程師們考慮的還是我的痛點是什麼?我要解決什麼問題?
這些微軟工程師的心路歷程都是一樣的。其實一開始誰都是懵的,有興奮、迷茫、徘徊、猶豫、質疑,這就是人的認知過程。沒得選,但誰都在摸索。科技行業是一個專制不服的實證行業,實踐是檢驗真理的唯一标準,人家把活做出來了,比你高效,比你便宜,比你的用戶滿意度高,那麼你再說它不行都沒用。但有時候在沒有被實證之前需要有信心,就像薩蒂亞早期決定投OpenAI的時候,沒有什麼證明,就是靠信心支持的。
在巨變的科技行業,真正的心法、秘訣是你信不信這件事能成。當所有人都說不能成的時候,當你知道有極大概率被證明是錯誤的時候,你願不願意往下走?因此,要想在科技行業成功是很不容易的,需要成熟的心智,穩定的心态,需要堅強、毅力和韌性。
因此,先别急着定目标,方向差不多就下水吧。原來不是大模型,是人的進步和生态的培養。某種意義來講,人們需要的不是ChatGPT這個工具,需要的是解決他們的問題。模型不能當飯吃,得把活幹了,幹活的時候,什麼趁手用什麼,再厲害的工具,沒有用就是沒用,再普通的工具,有用就是有用。真有那麼多新東西嗎?其實沒有什麼奇迹,全是信仰和堅持。
2022年5月,微軟董事長和CEO薩蒂亞 在微軟一年一度的Build大會上提到的GPT、OpenAI、Copilot等等當下的熱詞。我也經常反思,為什麼2022年5月我看到這個視頻卻不知道這些将會成為現象級的事物,如果我現在仍然以目前的思維邏輯,會不會在追新的狂熱中再次錯失下一輪進步?
下一次我們是見證者、旁觀者、追随者,還是開路者、參與者、貢獻者呢?預測未來的最佳方式是創造未來,創造未來的有效方式是躬親力行。我希望咱們學的過程不要站在岸上,要下水學,下水學習可能有點風險,因為結果是不确定的,所以要學會擁抱不确定性,同時對自己有堅定的信心,覺得我就是行,然後勇往直前。行的基礎是認為自己永遠會犯錯,鍛煉的是知錯和改錯的能力。
剛才提到了我們需要機器幫助我們應對這個世界的復雜性。那麼有了算力,問題就全解決了嗎?Ilya Sutskever說了兩個需要注意的點。第一,别人沒有的數據。機器會學習的前提是需要被人類以數據進行教導,只有擁有了别人沒有的數據才能教出一個符合你要求的機器出來。第二,以發展的眼光考慮發展。有一萬種理由可以說現在的技術不成熟,但是技術演繹的速度非常快,智能機器已經產生反饋能力了,特别擅長糾正自己的錯誤,我們用多模态、多模型、多輪的方式讓它們自己糾偏就夠了。同時,智能機器可以不斷地仿真遍歷(也是薩提亞說的Enumeration of simulation),把人們認知圈内所有的可能性遍歷一遍,大概率就可以解決人們的問題了。如果遍歷出幾億種可能性都無法解決的問題,那個點恰恰就是人類需要突破的地方。
建 議
建議一:知識的力量
在信息社會,知識既是力量,也是權力。數據既有風險,也有影響力。你在有知識的同時,還要有能力用數據去影響别人的知識,甚至是"沾染"别人的知識。
模因的傳播跟病毒是一樣的,很難靠物理方式攔截,一旦附着在某個能產生共鳴的有機體上,它就開始滲透傳播。因此,在知識領網域,單單分享數據本身就是一種競争方式。
在工業時代,東西的保值能力很強,存在自己的倉庫裡就行。而在信息文明時代,知識不用就不值錢。那麼,數據該不該保護?必須要保護,但在有能力保護數據的情況下,知識一年後就喪失了它的先進性,就沒價值了,那怎麼辦?分密級之後迅速把所有能分享的數據向全人類開放分享出去,這是信息時代中任何文明不被放入歷史博物館中的唯一方式。
這就要把你的知識進行分類。你有多少不能放出去的專有知識?據我觀察,任何一個公司或組織,絕對不能讓外人看的數據不超過20%,甚至可能不超過10%,剩下的百分之八九十都是可以發散出去影響行業标準、文化習慣、人類社會價值觀的通用知識。只有在信息文明時代才可以靠分享影響人類的思維方式。
還有一種知識叫做領網域知識。這個領網域包括公司、行業、民族、國家。每一個領網域都要知道哪些數據是需要分享出去的,讓未來的地球知識體系占一份你的味道。比如技術行業,開源既是一種分享,也是一種參與,更是一種影響和促進。
上一世紀五十年代,人工智能概念初始發端,諾伯特·維納在《人有人的作用》一書中特意在告誡當時趨于信息保守的行政體制"在變動不居的世界中,能把信息儲藏起來,而不使其嚴重地貶值,這種想法是荒誕的。信息更重要的是流通"。咱們都是從農業社會、工業社會過來的,不可避免地帶有成長過程中各種文明範式的影響。因此,我們要小心,要随時通過反饋的方式告訴自己,信息文明該怎樣生存和發展。
在機器"以數據為食"的時代,需要具備數據能力、知識豐度、文明貢獻和文化影響。數據能力既要滿足數據合規的要求,也要提升數據管理、利用與分享的能力。知識豐度是指多樣性的數據形成多元化的知識。文明貢獻是指,知識生成與分享的程度決定了對人類文明的影響力與領導力。文化影響則是數據的有效分享產生對社會文化的有效影響。
數據管理的本質是不能分享的絕不分享,能夠分享的必須分享。數據生成、管理、應用與分享的實力決定了各個民族、國家、機構與個人的全球影響力。
建議二:流程的挖掘
在信息文明的時代,所有的決策都會依據知識而做出判斷,因為流程而被實現。無論做什麼事情,都是從A點到B點,中間有很多變量。我把人要做的事情标記為紅色,機器幫我們做的事情标記為藍色。從早上睜眼起床到晚上閉眼睡覺,我們要用電飯煲、咖啡機、手機、電腦、汽車,機器在知識的積澱和流程的執行上面有很多先天的優勢,咱們已經進入了一個人和工具無縫結合的狀态。
沒有數字化,也不會有智能化。你會發現數字化改革,人才、組織、流程、產品和產業鏈缺一不可。
·人才(轉型-納新-代謝)
人才應當具備成長型思維,思想解放,願意接受新鮮事物,尤其是目前還不成熟的新鮮事物。當一件事已被證明百分百能成的時候還輪得到你嗎?所有的成功人士都是在成功率為百分之六十的時候按下按鈕。
·組織(改造-适配)
根據康威定律,一個系統化組織所開發的產品與服務必定帶有該組織的部門分割屬性。而逆康威定律則嘗試描述如何利用技術反向影響分割孤立的部門牆局限。組織中有部門牆會導致數據流通不暢,好多沒下水的組織會嘗試把部門牆打碎,但是有人在的地方就有江湖,很多公司剛打破一個部門牆,又建立起一個新部門牆。在數字化真正到位的組織,各個部門可以有自己的方法,甚至自己的語言,但是每一個部門或個體都是一個在數字化系統中以API方式輸入輸出的服務單元。在企業平台層面只能有一種數據和接口标準,但允許每個部門内部獨立,要求對外的任務輸入和能力輸出以API的方式開放,通過标準化的輸入輸出接口協同工作。通過技術本身的能力應對部門牆,而不是打碎部門牆,在包容多樣性的前提下實現"書同文,車同軌,行同倫"。
·流程(優化-再造-建模)
十幾年前Web3.0就存在了,那時它的目标是達到"人能理解,機器能處理"。早期Tim Berners Lee這批前輩們發現光有檔案網絡服務還不夠,要建立一個知識和數據的網絡,用一個資源描述框架把人世間的各種現象描述出來,做到人能理解,機器能處理。
·產品/服務(賦能-反饋-定制)
為了應對越來越復雜的社會與用戶需求,未來的產品和服務都需要一種可以實時反饋的信号進行糾偏,這既有數據安全和隐私保護的挑戰,同時又有實時反應的先進性,核心還是數據分級和治理的能力和執行力,既不能因強大而濫用,也不能因數據治理的懶政而一刀切的封閉。由于都是新生事物,還是一個"認錯-知錯-改錯"的糾偏前行過程。
·產業生态鏈(優化-納新-重構)
開源為什麼那麼重要?因為你的技術再先進,别人不用你的,就沒有用。信息文明時代知識的價值取決于别人願不願意用你的東西。API将會是信息文明時代能力表征的語言方式,你把你的API分享出去并且被大家所接受,你會發現世界就跟着你的習慣前行了。
為了智能化而進行的數字化轉型產生的數據,才是真正為信息文明而生的數據,從中才能最高效地提煉出人類能理解、機器能處理的知識,再到Copilot作為智能助理。有些人糾結到底是Copilot還是Autopilot,我認為只要是以人類目标為目标,決策與行動鏈中人類保留一票否決權的機器功能,就是Copilot。因此真正的問題是有人類設計出來的機器機制中有沒有"人在決策/行動鏈中"(Human-in-the-loop)和"人在機器優化/改進鏈中"(Human-on-the-loop)。
什麼是加法邏輯?什麼是乘法邏輯?有技術是加法邏輯,但有作用一定是乘法邏輯。一旦把技術内化,融入到每一個環節、步驟、流程,它就是一個乘法概念。薩蒂亞經常說,模型不是產品,模型可以成為產品的一部分。當模型内嵌到用戶體驗產品的每一個環節之中時,模型就有用了,而模型一旦有用,就變成了產品的一部分。
執法依據流程,流程重在執行。人擅長創建流程,也擅長破壞流程,但不擅長遵守與受制于流程。而機器擅長嚴格遵守與執行流程,也擅長通過反饋學習以優化流程,但不擅長創建流程。在人機協同的時代,人幹人的事,機幹機的事,最終我們一定能讓自己的智慧更新。
建議三:落地的次第
技術平台的成熟度也遵循着有,用和有作用的邏輯。一般來說,都是先要擁有技術,而有能力徹底改變一個社會運作範式類型的產品或服務的一個特點是,需要全社會都使用它,它才有作用。比如今天咱們總是談ChatGPT,實際上在當前這個時代,這種以大語言模型為基礎的人工智能的使用率是極低的,大部分人都沒有在用,就算有些人用了也只是淺嘗辄止。為什麼呢?因為它必須是在你工作、學習、生活方式改變的情況下才能起到作用。模型是沒有用的,它必須要成為你產品的一部分。
我們一定不能陷入"過了這個村就沒這個店了"的想法,我們要時刻看着自己,利用新能力改造自己的流程和行為範式,進行基礎建構,形成核心競争力。首先是"有",具備這個能力。接下來,開始通過培訓、流程再造等進行賦能,這就是"用"。數據生成到這一步,大部分人就開始意識到,以顯卡為代表的算力只是一個必要條件,還得有數據、人才、場景,那麼就看哪一家能看得比較遠,能夠把目标看清楚,最終還是要"泛在"。
這類技術現象級的產品不會經常出現。我覺得"電"算一個,"互聯網"算一個,這一輪"人工智能"算一個。電花了一百多年才到完全完備,互聯網從一九六幾年算起,到現在也差不多六十多年。原來我的一個老總說,在業務中,尤其是搞技術、搞軟體的,特别容易忽略物理性的局限。人們傾向于關注如何擁有某種技術能力,但不要忘記在擁有技術能力之後還有漫長的學習與适應的過程與投入,而真正起作用,xuyaodengdao整個社會型态與文化習慣與技術能力相匹配。"想到"、"聽到"跟"做到"、"做得讓用戶滿意"之間差距是巨大的。
我曾經分析過一些國家的GDP數據,能源、電力等社會關鍵基礎設施的應用和能力不過就占整個社會GDP的百分之十以内,但而且最後一般都發展成國家擁有,因為它太重要了,重要到不可以純粹以商業的想法來評估它。不是說不去做關鍵的基礎設施,只是越關鍵基礎的東西,耗時越久,你要做好坐三十年冷板凳的準備。
其實這三個環節沒有一個是容易的,關鍵還是在于你适合什麼樣的業務方式、生活方式、工作方式以及邏輯方式,然後再選擇适合自己的。希望大家能成為劇烈動蕩時代中技術的主人,而不是被它牽着到處跑。
在落地的時候,大部分公司專注于有,就是買技術、買產品、買設備,實際上第二步培訓和流程再造是非常困難的工作。公司的決策者一定要知道,你花了100塊去買一個能力的時候,最好還要準備另外100塊讓你的機構能夠享受到它的好處。第三步就是讓你的客戶能夠接受。知道這個客觀規律之後,我們就可以知道這是小馬過江還是小馬過海,從而在精力投入、資金投入和回報期望上,能夠比較理性一點。
技術真正做深了之後,必談你的技術信仰,你到底為什麼做技術。比方說我就一直說我是工程師,是一個Maker,一個Builder,我的人生觀、價值觀就是以造物為享受。你的初心是什麼?你的人生使命是靠"面子"就能活,擁有一個技術去評個獎就擱置一邊了,還是不管怎樣一定把這"裡子"拿到,要實現技術為人類社會增添福祉為終身追求,或者既要有"面子",也得有"裡子",這也是技術選擇的不同取向。我覺得,在當下的時代,無論是面子、裡子,咱們都别耽誤了,但始終别忘記,大眾要咱們貢獻的是"裡子"。
建議四 智能的本質
遠取諸物,近取諸身,則近AI之道矣。學過認知神經科學的人就比較熟悉了,人工智能的那些用語大多是從認知神經科學借過來的。比如說短時記憶,短時記憶可能只能維持幾秒鍾,但是非常高效。又說記憶存在于神經細胞之間的連接中。短時記憶和長期記憶先要跟輸入進來的信号做比對,比對完的高低就是一種判斷,接着進行推理,就是跟你過去的記憶做對比,一步步往下走。明白這些的話,就能知道其實人的基礎構型也是二進制的,只不過這種二進制的實現極其復雜,不僅僅是電腦那種硬性的開和關,更像是量子計算那種開和關以及又是開又是關。
在判斷、推理、規劃完之後,就產生行動,之後再產生一種結果,這結果再反饋回來,跟原來接受的信号進行比對,知道你下一步該怎麼辦。
人類有目的,機器有能力,它就根據人的要求把事兒給做了,基于這個結果,人還會再反饋給機器,告訴它下次還可以做得更好。這也是機器本身不斷糾偏、優化、完善的流程,這就叫做強化學習模型。
我對這個模型做了一個微小的調整,給它加了一個更大的環境,一定是跟環境不斷互動交流,才能形成一個智能體。它的基本範式是智能機在一個環境中,并且產生了一些互動關系,再通過觀察外部狀态,學習比對數據,形成一個結果。數字化的目的就是讓你知道每一分每一秒你離你的目标差多少。
把這幾個系統綜合就是I-P-O-F,這是系統工程的一種元模型。輸入一個目的,對長期記憶中的知識進行思考以形成理解、推理、規劃,再通過人體與工具組合的行動輸出一個結果,最後将輸出結果反饋至輸入,不斷糾偏完善。
微軟開源了一個大語言模型開發框架,稱為Semantic Kernel,非程式員初看可能有點復雜,但實際上你是不用去管内核的,你只需要知道把你的提問放進去,期待有個結果就夠了。最多你把你的判斷返回給提問,讓它不斷糾偏,這恰恰是提示詞工程建議大家做的,就是不斷提問,多問幾輪。一旦明白I-P-O-F這個不斷循環的過程,你就能夠大致體會怎麼去和機器打交道,你怎樣嵌入到機器的I-P-O-F中,你怎麼讓機器嵌入到你自己作為人類的I-P-O-F中。
大家有沒有這種體會?準備讓員工去幹活,但是想了想算了,自己幹吧,自己幹得快得多,但是如果有100個這樣的活讓你幹呢?你還是得交出去。機器也是一樣,它一開始一定沒有你做得好,那你有沒有這樣的信心、耐心和決心在未來五到十年訓練出一個可以分身的孫悟空,幫你應付信息時代的挑戰?
早期人類文明什麼都沒有,後來有了工具。再後來形成集群,進入農業文明。之後又進入工業文明,人們越來越聚集,知識越來越可重復,工具越來越復雜。再往下走就是信息時代,自動化程度更高,出現了互聯網、移動互聯網、人工智能、大語言模型服務以及多模态、多模型和智能體集群。未來冰球要滑到哪裡?我們應該鍛煉一下這種想象力,不能因為我們跟在冰球後面就認為它沒有規律,它是具有概率性規律的,我們要發揮人的主觀能動性來進行判斷。
Agent意為做、行動,引申為智能體。以AutoGen智能體為例,是有很多Agent集群幹一件事。在AutoGen的論文中舉了一個例子,首先,有一個負責總籌劃的指揮員,如果現在要寫一個東西,該怎麼做?你就來分配任務,術業有專攻,我告訴你我的目标,你來寫這個東西,之後我再交給Safeguard審核一下,這個過程不斷迭代、優化、完善,直到滿足人類的需要,其中最大的特點就是"人會做的機器覺得難,機器會做的人類覺得難"。找到雙方的優劣,取長補短就是了。
Agency意為行動的狀态或能力,引申為能動性。一個智能體如果具備主觀能動性,那這種能動性一定是人賦予的。知道這個道理我們就明白了,我們更要去分享我們的知識、習慣,否則智能體的主觀能動性就是别人賦予的,萬一不符合你的價值觀和規則,不就吃虧了嗎?
這一輪人工智能代表的是一種概率性能力,但千萬别忘記機器還有确定性的一面。沒有确定性的是人類社會,正是需要機器的确定性來幫助我們應對不确定性的問題,不要以為計算機編程過時了,它具有非常完美的确定性,這種能力遠沒有過時。
向機器學習
我總結了一下可以向機器學習的三點:初始化、反向傳播和梯度下降。初始化的要求就是沒有傾向性,可以随時刷新。很多企業決策者不知道該如何決策,如果開始用這種方法,預埋很多數據點,說白了就是可以在小仗中失敗一下,目的是知道離目标還有多遠,不糾結于犯錯,專注于改錯,這反而可能是成功的一個保障,因為你一直知道離懸崖邊有多遠。反向傳播就是反饋糾偏,而梯度下降的要義就是不要過早陷入本地最優解,永遠留出多樣性以期到達全局最優。
由這三點又產生了一些方法論。第一個是Cynefin框架,設定方向,不設定終點。第二個是三錯法,從認錯到知錯再到改錯,也可以總結為"獎一錯,防二錯,罰三錯",出錯,意味着做事了,要獎勵;再錯,情有可原;老是犯同樣的錯,說明沒動腦筋,敷衍了事。第三個是三階法,從How到What再到Why。這是與Why-What-How的演繹法相反的路徑,原理是一樣的,只不過是歸納法的學習過程。演繹過程說起來容易,做起來難;連接式與行為式的機器學習過程是歸納法的,人類可以從中借鑑到許多本來就是人類學習的優秀範式。人類本來就具備創造性、多樣性、不确定性與相應的适應性與主觀能動性。只不過由于人類的自大,這種試錯法的探索學習方式,被固化思維和閉卷考試的習慣給抹殺了。
别那麼着急下結論,也别什麼都信。《看不見的大猩猩》的作者去年又寫了一本書,叫做《沒人是傻瓜》,他在書裡說,信息爆炸時代的一個基本生存要義叫做Take less check more,就是少相信一些,多驗證一下。在某種極端情況下,我甚至認為它應該是Take nothing check everything。因為信息能夠被機器輕松地復制或偽造的話,人們真的需要養成随時驗證的習慣。這時就出現了一個悖論,你人類單單靠自己可以随時驗證每一條信息嗎?要靠魔法打敗魔法,人類社會發展至今,沒有機器智能作伴的人類是很難生存發展好的。
選好大致方向而不是終點,在行動中緩慢、堅定地糾偏前行。我們能不能稍微改變一下自己的判斷分析邏輯,讓我們能夠敢于下水實證,同時要加一些保護機制,也别淹死了。讓機器告訴我們離懸崖邊還有多遠,訓練出自己的一些分身,往前走就完了。至于會怎麼樣,沒人知道,但我們知道,這道門一旦打開,嚴格意義上應該關不上,所以咱們還不如就擁抱變化,與時俱進。
微軟的使命是讓地球上的每一個個人和組織成就不凡。這不是口号,而是真實在發生的,根據我的親身經歷,微軟的很多工程師、科學家真的是以這個為願景,而且因為有積極的助力,其產出也會越來越大。
其實,今天我就是把微軟工程師從去年開始到現在的親身經歷跟大家又重新演繹了一遍,我堅信每個人都會走這麼一個過程,就算不是大語言模型,也會有其它東西。現在這道門是真的打開來了,我們可以選擇不理它,我們也可以選擇什麼都信,我們也可以選擇審辨式、批判式地去理解、吸收和改變自己的行為方式,走出一條自己的道路出來。我覺得如果能達到這個目的,就善莫大焉了。