今天小編分享的教育經驗:對談張亞勤:我預演中的AGI地圖,歡迎閱讀。
以下文章來源于騰訊科技 ,作者張小珺
作者| 張小珺
來源 |騰訊科技 管理智慧
咨詢合作| 13699120588
文章僅代表作者本人觀點
"未來會有新的物種,它将是人類的延伸,然而終究是一個全新物種。"
人人都談論AGI,但未來AGI到底是一幅什麼樣的畫面?
針對這個話題,我們在2024年底訪談了清華大學智能產業研究院(AIR)院長、前百度公司總裁張亞勤院士。
在他的腦海中,人工智能會按照"信息智能>物理智能>生物智能"的圖譜逐步逼近和實現AGI。這種構想和信仰之下,AGI呈現的是一個樂觀的前景畫面。
在他看來,信息智能的AGI5年内可達到;物理智能的AGI分階段達成,如人形機器人大約需要10年達到;而最終的生物智能需要花費15年到20年。
到那時,人類大腦不僅能得到全方位的拓展,人類還能大幅度延長壽命,甚至"未來會有一個新的物種"。
"回顧3萬年前的人類,你會覺得那和現在的人類是同一物種嗎?"張亞勤說,"3萬年前的山頂洞人,屬于猿人階段,那時人類雖已開始使用工具,石器時代也有了火,但工具極為原始。如今,我們擁有手機、電腦與互聯網。倘若再過100年,後人看我們現今的手機、互聯網以及個人電腦,或許就如同我們看待3萬年前的火與石器一般。而且,這種進化的速度正變得愈發迅速。"
故而他認為,"或許只需30年,至多100年,到那時,新的物種會比現在的人類聰慧得多。但它依舊由人類掌控,受我們的意識支配"。
以下是對張亞勤院士的訪談。
信息智能:是大腦的智商
張小珺:你之前提過未來20年在實現AGI的路上,會逐步實現信息智能、物理智能和生物智能,能不能推演一下你腦海中AGI路線圖?
張亞勤:我一直認為,新一代人工智能是信息智能+物理智能+生物智能。
信息智能很簡單,就是ChatGPT,所有文字、影像、視頻,是信息世界的智能。
物理智能是把它用到無人車、機器人、現在講的具身智能,用到基礎物理設施去。
生物智能是把人工智能用到比如腦機接口。像ElonMusk的Neuralink,連到生物體、生命體,包括醫療、手術機器人和新藥研發。這些領網域當然相互有聯系,但它是不同領網域。
我認為5年内,我們在信息智能方面,可以通過圖靈測試,達到AGI水平。ChatGPT出來,在文字方面基本達到,後面要加推理、多模态。Sora,希望很快出來。再過一段時間,在自然語言和自然内容上,我們生成的圖片、視頻,5年内,在信息智能方面達到人類的水平。
張小珺:我們先來講講信息智能,信息智能可以改寫整個現在的商業生态嗎?
張亞勤:人工智能本身并沒有改變商業實質,你該做什麼,還是做什麼。它就是把生產力大幅度提高,會催生出一些新的商業模式,但商業本質并沒有改變。
現在,用AI寫郵件、寫文章更方便,編程效率更高,解數學公式也能靠它。在這些方面,AI會超越普通人,甚至超過數學家、物理學家,其智能水平相當于人類,甚至更高。
人工智能更多體現的是智力。想象一下,有個人腦袋特别聰明,能做很多事。能解題、發明新公式、寫出好文章,還能畫畫、作詩——所以說人工智能就像是我們大腦的智商體現。
以遊泳為例,就算你讀再多的書,不實際去學,還是不會遊泳,必須要在水裡練習才能學會。這個就是物理世界的特性,得在實際的物理環境中實踐。好比你愛喝酒,不管你多聰明,讀多少書,不親自品嘗還是不知道酒的滋味。
信息世界裡,人工智能可以做到像一個博古通今、智商極高的人,這在5年内就能實現。
物理智能再需要點時間,物理智能比較高的等級是我們講的人形機器人,可能還需要10年。10年是不是完全比人厲害?肯定在大部分任務上會超越人類。
物理智能:與其叫機器人,
不如叫"機器anything"
張小珺:物理智能第一個落地的是自動駕駛。
張亞勤:是。無人駕駛是一個相對來講可控的領網域。
機器人領網域屬于開放性問題,而自動駕駛則是封閉性問題。就自動駕駛而言,它只專注于開車這一件事,并且能把這件事做得特别出色。但機器人不一樣,它需要具備常識,要理解人類的行為,還要應對諸多復雜的環境。
可以這樣講,無人駕駛其實是一個會開車的機器人,屬于垂直領網域的機器人,也是應用于特殊場景的機器人。
舉個例子,開車技術好的司機,不需要會寫詩,不需要有超高的智商,也不需要會唱歌或者懂生物知識,只要把開車這件事做好就行。這就跟工廠裡負責焊接的工人一樣,專注做好手頭這一件事。然而,人形機器人面臨的要求就要多得多。
在機器人的應用方面,我将它抽成三種大場景:一種是家庭機器人,一種是工業機器人,一種是社會機器人。
家庭機器人的概念很容易理解,它主要在家中照顧老人、幫忙做家務,還能陪人聊天。不過,家庭機器人的研發肯定是難度最大的。
社會機器人應用的場景,像警察、保安執行任務,送外賣,還有開車等,都屬于社會行為的範疇。未來,警察隊伍可能依然需要一些人類警察,但大部分警務工作由機器人來做就很不錯。機器人保安或許會比人類保安更出色,當然,它得聽從人類的安排,充當人類的助理角色。或許過不了多少年,開車的人就會越來越少,無人駕駛将成為主流。
張小珺:無人駕駛也是社會機器人?
張亞勤:對,那些在街上穿梭、能與大眾頻繁互動的機器人,屬于社會形态的機器人。
除此之外,還有工業機器人。像在危險環境中,比如礦山裡,或是在工廠内部從事精細作業的機器人,都屬于這一類。相對而言,工業機器人的目标較為明确,且是在特定場景下執行任務。
但我們希望後台的技術是通用的。即便在前端,比如在具身智能方面,或是在邊緣計算環節,表現形式可能有所不同,但底層技術最好能通用。
張小珺:你說的是家庭、工業、社會都是通用的?
張亞勤:對。一個通用的後台大模型。我希望它70%-80%的後台技術都實現通用。
張小珺:這個巨大的模型會是今天像OpenAI這樣的模型?
張亞勤:是。這些模型必須要多模态,要從物理世界學習東西,然後大模型再把它變成智能。
最後做的時候還是每個地方不一樣。但這個後台基本是統一的後台,所以是通用平台。
張小珺:今天大模型和自動駕駛還是兩套架構,現在是沒有辦法融合在一起的,但未來是肯定會融合的。
張亞勤:對,我們現在後台都是大模型。在此基礎上,又針對自動駕駛構建了一個垂直模型,這些都部署在雲端。而在車上,還配備了一個小型的邊緣模型。我将其歸納為三個層級。
就像作業系統一樣,作業系統是一個雲端作業系統,上面搭載着SuperApps,當部署到手機端時,又有相應的應用程式。今後,不管你把它們稱作App還是Agent,本質都是為了完成特定的任務,只是這些任務在不同領網域會有所差異。
舉例來說,工業機器人完全沒必要做成拟人形态,只要能把相應的工作完成就可以。但家庭機器人的話,拟人形态可能是最佳選擇。不過,家庭服務機器人也并非一定要是人形,可能會是類似狗或貓的形态。就像盲人出行,以後或許有機器狗就能引導其行走。
所以說,與其局限于"機器人"這個稱呼,不如把這類機器統稱為"機器萬物(機器anything)"。
張小珺:為什麼家庭機器人最好是人形?
張亞勤:人形機器人和非人形機器存在着明顯區别。以家庭場景為例,家中老人在與人形機器人進行溝通時,會比與電腦或其他非人形機器的交流更為自然順暢。
随着技術發展,未來人形機器人的外形會與人類高度相似,甚至達到以假亂真的程度,進一步提升人機互動的自然度。你可以跟它談心,把它當作伴侶,還能讓它幫你處理各種事物。它就變成像你的管家一樣。
另外,為什麼要有人形機器人?這是因為當下的社會環境,包括各類基礎設施,都是依據人類的特點和需求來設計建造的。像爬樓梯、按按鈕這類操作,對于人形機器人來說相對容易實現,因為這些設施本就是按照人類的使用方式來設計的。但這更多的是一種選擇吧。
再看社會機器人,就拿警察機器人舉例,如果它的體型過小,會讓人覺得缺乏威嚴;若體型過大,又會給人帶來壓迫感,讓人感到不舒服。而設計成人形的話,就會給人一種仿佛是人與人在交流的感覺,更符合人們的心理預期。
張小珺:避免"恐怖谷效應"。
張亞勤:對。這更多是一種社會進化,你看到的是你的同類。
我一直講,或許10年之内,機器人的數量就會超過人類,而且每個人可能自己都有一個你的copy,你的機器人。像你的替身一樣。這個機器人能幫你處理很多事,簡直就像是你的分身。希望以後每個人配備一個分身,畢竟分身太多可能會引發一系列問題。
這個分身從屬于你,對你唯命是從,扮演着助理的角色。這個助理十分聰明,甚至比你都厲害,但它始終會聽從你的指令。
張小珺:它屬于家庭、工業,還是社會?
張亞勤:都可以。你如果在家裡就是家庭機器人。你如果到工廠上班,工廠裡面可能有你的機器人,幫你做事。這兩個場景不一定要是同一個機器人,但它必須要适應不同的場景。
張小珺:社會機器人和家庭機器人,哪個更難達到?
張亞勤:看情況。所有人形機器人都不容易,需要很長時間。所以我覺得,大概5年或者10年,慢慢地就能看到人形機器人的一些初步樣子了。
在機器人這塊兒,無人駕駛機器人算是我們已經有成果的領網域。
我剛從舊金山回來,坐了Waymo的無人駕駛車,體驗特别棒,它開起來比人開得還平穩順滑。關鍵是,現在舊金山的市民都樂意坐這種車,已經不覺得這是什麼新鮮玩意兒了,甚至把它當成出行的首選。
張小珺:今年蘿卜快跑在武漢,公眾還不太能接受這件事。
張亞勤:對,現在蘿卜快跑安全性比有人駕駛要高至少10倍,同時開得也很好。雖然落地時間比較短,但乘客評價卻很高。目前來看,大眾還是認為它是一個新興技術。
對比中美,阿波羅和Waymo是屬于走在最前的,你看到了就會說這是未來的無人駕駛。但無人駕駛可能放到現在車裡,也可以作為出租車的一種服務,這是商業模式問題,因為技術能力已經實現了。
張小珺:你怎麼看馬斯克代表的L2+路線和Waymo代表的L4路線,馬斯克也認為他的L2+能夠上升到L4。
張亞勤:可以上升到,但現在仍處于發展階段,還需要進行大量測試,并且要依靠新技術的支持。就目前而言,它還存在一些局限性。
當下的FSD(完全自動駕駛)系統還沒辦法實現真正意義上的Robotaxi功能,因為FSD設計的是有人參與的駕駛模式,在行駛過程中,人依然可以接管車輛操控。而真正的Robotaxi是完全不需要人接管的,甚至未來連方向盤都不會配備。這對技術的要求相當高。
不過,值得一提的是,這個看似很高的技術要求其實已經有人實現了。要是特斯拉着手去做這方面的業務,以它的規模,影響力會更大。而且以後,其他汽車企業也都有能力做到這一點。
張小珺:車企以後都可以做到?
張亞勤:都能。Waymo和百度在中國和美國證明無人駕駛技術是可行的,這個我覺得很重要。這個時候大家就是看誰跑得快點,跑得慢點,商業模式怎麼落地。
看到曙光了。
兩年之前我覺得還看不到。像我是一直有信心的,但你問我什麼時候發生,我也不知道,現在很清楚了。
張小珺:如果車企能做的話,他們自己本身就有車隊,對比Waymo或者百度阿波羅這樣的產品,商業模式會不一樣嗎?最後這個賽道屬于誰?
張亞勤:大致想來,存在三種類型的企業:
一種企業是提供服務的企業,例如當下的滴滴,以及傳統的出租車運營公司,它們都致力于提供運營服務。
一種是做整車制造的企業。
還有一類企業專注于生產車内相關產品,比如芯片,像地平線、英偉達這類公司便屬此類。有些公司可能選擇只專注于汽車制造,不涉足Robotaxi服務;而有些公司則僅開展服務業務,使用其他公司生產的車輛。這種情況在行業中都會出現。
就像特斯拉宣稱自己什麼業務都做,這當然也可行。如此一來,企業之間便會形成一定的競争态勢。但最終誰能脫穎而出,還需拭目以待。而且,最終勝出的不會只有一家,而是會有多家企業在市場中占據一席之地。
張小珺:李想(理想汽車CEO)和何小鵬(小鵬汽車CEO)都說他們做L4的技術,但不會做Robotaxi的平台方。
張亞勤:可能很多車廠不做這個事。就像現在一樣,不做出租車生意,只是銷售汽車而已。這種情形在未來依舊會存在。總之,整個產業包含三個關鍵部分:其一是服務,其二是車輛,其三則是車内的芯片、元件等部件。
張小珺:為什麼自動駕駛、具身智能在今年這麼火?
張亞勤:如今大家都看到行業發展的曙光了。其中,大模型成為了一個關鍵的促進因素,可以說是引發變革的導火索。我先講無人駕駛,再講具身智能。
多年來,無人駕駛一直面臨着幾個主要難題:第一個問題是數據量匮乏,要大量的測試數據;其次,存在諸多極端情況(cornercase),在實際駕駛過程中,許多場景下的安全問題并不容易遇到,然而在測試時,卻又會遭遇各種新問題,這反映出無人駕駛技術的泛化能力較差;最後,人工智能技術方面,各類模型較為分散,例如地圖構建是一個模型,視覺識别是一個模型,語言處理又是另一個模型,呈現出碎片化的狀态。
這些碎片化的模型,要将它們整合在一起,既要進行感知,又要完成融合,還要做規劃以及決策,只能逐個部分去處理。而且其中包含大量規則,有人工智能算法、神經元算法,還有許多固定規則,拼湊得雜亂無章。
大模型出來之後,不能講完全解決,但能加速解決這些問題。
針對數據不足的問題,生成式AI能夠依據真實數據生成大量數據,這使得整個模拟、仿真的速度大幅提升。
關于場景不足的難題,大模型自身具備出色的泛化能力,也就是所謂的常識。大模型不僅擁有常識,還能通過模拟器學習這些常識。因此,即便遇到許多未曾接觸過的情況,它也能較為輕松地解決問題。
大模型推動了端到端解決方案的探索。将所有這些模型整合起來,只需一個輸入,就能得到一個輸出,最多利用一些規則來保障安全。
所以,這三個大的挑戰不能講完全解決,但至少得到了很大程度的緩解,大幅度加速了無人駕駛的這種開發的進程。
張小珺:馬斯克提出的端到端模型是一個讓大家看到曙光的重要產品。
張亞勤:端到端的方案大家都在研究推進,而且很快就能投入應用,我們現在也已經開始采用。
大模型的出現,極大地加速了相關技術的發展,徹底改變了整個行業生态。以前,我們雖然也有類似的想法,但缺乏足夠的認知與技術支持。如今大模型問世,讓我們有了實現這些想法的可能。
現在大家都采用Transformer架構。過去可不是這樣,一會兒用卷積編碼(ConvolutionalCode),一會兒又用循環神經網絡(RNN),算法繁雜多樣。這其實就是上一代人工智能,深度學習第一代和第二代的區别所在。那時針對不同的輸入,要采用不同的算法,產生不同的輸出後,再進行融合處理。但現在,無論輸入是什麼,都用同樣的Transformer來處理,也就是基于Token進行處理。
無人駕駛領網域如此,具身智能領網域同樣如此。
就拿機器人來說,機器人面臨的問題,基本上和無人駕駛類似。只不過機器人領網域的數據更為稀少。而且,在過去,機器人在數字空間進行模拟時,通常采用強化學習的方式,設定一個環境和智能體,讓智能體通過學習找到一種策略,然後應用到實體機器人上。然而,實際應用中卻常常發現這種策略并不奏效。
現在,AIR(清華大學智能產業研究院)正在研發RSR技術,這項技術将真實世界與物理世界緊密連接起來,從而加快了機器人技術的發展。也就是說,在模拟世界、數字空間裡進行學習所獲得的成果,能夠更好地應用到實際中,讓機器人技術更快落地。
張小珺:這個叫世界模型?
張亞勤:你可以講構建了個世界模型。我把它叫RSR,就是RealtoSimtoReal。
這裡的"Real"指的是真實世界中的事物。我們從真實場景出發,通過分析将其轉化為數字世界的内容,這就是"從真實到模拟(RtoSim)",也就是模拟(simulation)過程。在模拟階段,我們能夠運用各種AI生成工具,比如StableDiffusion這類當下新型的生成式AI工具,生成大量内容。借助這些工具,我們把數字世界與真實世界緊密相連。
如此一來,在數字空間裡學到的東西便能立刻應用到實際中,這就如同無人駕駛領網域那樣,有效地彌補了數據不足的問題。
張小珺:它像是積累了一堆的常識,然後再灌給它。
張亞勤:第三點至關重要,即擁有一個大型模型。在過去,機器人面臨的最大難題是無法理解人類意圖。它或許能識别聽到的字詞,卻不明白背後的含義,缺乏基本常識。
機器人既沒有理解力,也不太具備推理能力。然而,大型模型出現後,情況就大為不同了。這就好比大模型充當了一個"大腦",可以對前端的機器人進行指揮。這是一個巨大的飛躍,歸功于大模型所具備的常識。
舉個例子,對于家庭機器人,我下達指令:"你幫我把髒衣服拿下來,送到幹洗店洗好後再拿回來。"放在過去,機器人完成這樣的任務難度極大。但現在相對輕松很多,因為像ChatGPT或者GPT這類模型,在接收到指令後,能夠理解其含義,并将指令分解為具體動作,進而指揮機器人去執行。
張小珺:加了個"腦子"。
張亞勤:現在機器人就好比多了個"腦子",而這個"腦子",在過去可是機器人最難具備的東西。過去,每一項任務對機器人來說,都是巨大的挑戰。但現在不一樣了,我們實現了很自然的人機對話,大模型能理解我說的話,然後把任務分解,指揮機器人去執行。
機器人的應用場景特别繁雜。就好比做早飯的機器人和掃地機器人,它們的任務完全不同,不能一概而論。但我們希望機器人的"大腦",也就是後台系統是通用的,只是前端執行部分有所差異。
過去的做法是,掃地機器人是一套獨立的系統,和做飯機器人毫無關聯。洗衣服、焊接元件、質量檢測、開車等不同功能的機器人,各自都是專用的,相互之間沒有聯系。但現在,後台本質上是一樣的,只是前端根據不同任務有所區别。
這就好比人,一個人具備多種能力。人通過學習擁有基本常識和智能後,既能學開車,也能學掃地。
無論做什麼,還是同一個人,不需要每次換個"腦子"。
張小珺:今天開車這個場景是相對确定的,其他工作還不好說。
張亞勤:打個比方,以前我常開玩笑說,機器人會開車卻不會開門,就算能開門,又開不了微波爐,即便打開了,還不知道怎麼關上。諸如此類的小細節問題,要是每個都專門設定一種新算法,那可太麻煩了。
早期,人們嘗試用各種規則來解決這些問題,但現在不同了。現在有了大模型,機器人一看就學會了。學會之後,不管遇到什麼東西,它都知道怎麼開,也知道該用多大勁。比如說它給你端茶,知道茶是熱的,還會提醒你小心。類似這樣的事它都能做到,這就是所謂的具備了常識。
那常識從哪兒來呢?就是從大模型中來的。不需要在每個細節上都教它,過去那種一個規則接一個規則地設定,得定多少規則啊!現在不用這麼麻煩,機器人學會之後就能舉一反三,就跟人一樣,學會了就會自己推理。
比如說,你告訴它你餓了,想吃點東西。要是它知道你愛吃香蕉,就可能在房間裡找到香蕉拿給你。要是訂餐,知道你不吃羊肉,點餐的時候就不會給你點羊肉。它會具備這些常識,不需要把每個細節都記下來。它就像人一樣,能理解你,知道這些最基本的生活常識。
張小珺:今天落地自動駕駛和後面的具身智能分别的難點是什麼?
張亞勤:為什麼我覺得信息世界相對簡單些呢,因為在信息世界裡,你只要有一部手機或者一台電腦就基本能開展相關活動了。然而,信息世界在部署場景方面,自身的周期會比較漫長,而且難點眾多。
以無人車為例,要讓無人車能在路上正常行駛,首先就會面臨政策法規方面的問題,同時還得解決如何與有人駕駛車輛在道路上相互協調的問題。所以,在這樣的物理場景中,要打造一個完整的世界模型。但如果是做虛拟世界,就不需要考慮這些,只需要構建一個物理模型就行,可這也并非易事。
機器人的情況也是如此。比如說,要是用輪足式機器人送外賣,那它該如何上下樓?又要怎麼開門?這些具體場景對技術的要求更為復雜。
在每個場景落地的過程中,這些細節問題都需要耗費更多精力去解決。這就好比上學,上課的時候有書本就夠了。大模型在信息世界裡就如同讀書,讀了很多書後變得很聰明,能夠總結出各種道理,也能表達出來。但真正要付諸實踐的時候,還是得實實在在地去做。正所謂"行萬裡路",做事還是需要具備相應的技能。
對于機器人而言,關鍵就在于如何将技術真正落地?數字世界和物理世界怎樣才能實現良好的互動?不同場景下情況各異,有些場景可能相對簡單,有些則可能難度更大。
張小珺:信息智能,似乎該去的公司都已經入局了,自動駕駛也是,今天不可能再說我要做一個自動駕駛的公司。
張亞勤:不能一概而論地說信息智能就簡單。信息智能領網域同樣存在不同方向,也有垂直細分領網域。比如說,有的是做橫向發展的,但在這個範疇内,可能又會細分出諸如生成圖片,或者幫人編寫代碼這類垂直場景。
當下,自動駕駛正處于爆發階段。你看相關的公司如地平線這類做芯片的,正逐步崛起。它們已經邁上新台階,成功上市,不僅有了產品,還能提供服務,大眾也開始認可它們。
未來5年,這些公司有着廣闊的發展前景。不過,要做好任何一個項目,确實都需要相當長的時間,1-2年通常難以達成目标。就機器人領網域而言,尤其是人形機器人,目前在做的公司,可能要八年甚至10年之後才能有所成果。
我之所以說物理世界的通用人工智能(AGI)會在10年内實現,是因為我認為到那時,AGI将成為主流趨勢。
張小珺:做自動駕駛的車企直接開始做機器人會更容易嗎?
張亞勤:裡面很多共性,最後可能還是看你怎麼落地。
機器人整體來講,要稍微更復雜一些,需要的東西更多。但做無人駕駛是需要更精準一些,因為比如說有的機器人它速度很慢,它比如随便講做早餐吧。做早餐,它整個速度慢點、快點沒關系,但你開車不行的,開車你在多少這個毫秒中犯錯就不行了,它的實際需求和要求不一樣。所以每個場景的技術也不太一樣。
但這裡面後台東西都是一樣的。首先你需要一個感知模型,你要感知環境,你要理解,你要有action——vision、language和action(VLA模型),這個model還是有的。
生物智能:
拓展大腦,延長壽命,誕生新物種
張小珺:再往後,生物智能呢?
張亞勤:生物智能的實現需要更長時間,因為生物智能需要通過或者植入或者非植入的方式,把我們的大腦和機器連在一塊。
我更看好非植入的,看好用更好的、更敏感的傳感器,包括一些機器和大腦的接口,新的技術發展很快。
張小珺:我們能在有生之年看到嗎?
張亞勤:可以看到,我認為20年之内可以實現。到那個時候,我們人類的大腦将得到全方位的拓展。
大腦的拓展體現在多個維度上。首先,在記憶方面,我們将擁有近乎無限的存儲能力。這意味着,很多事情我們無需再依靠自身有限的記憶去記住,存儲設備能夠幫我們記錄下海量信息,極大地減輕了大腦的記憶負擔。
其次,智能化發展會讓我們變得更加聰明。最初,它可能更多地應用于醫療健康領網域。例如,對于盲人,相關技術可以通過刺激對應的神經細胞,幫助他們恢復一定的視覺能力;對于聾人,能夠刺激聽覺神經,改善聽力;針對殘疾人,還能嘗試連通并修復受損的神經以及大腦中樞神經,助力他們恢復部分身體機能。
不僅如此,像老年人常患的阿茲海默症,以及小孩的多動症、自閉症等病症,也可能借助這些技術得到有效的治療或改善。
随着技術的不斷發展,其作用将不僅僅局限于醫療康復,後續還能夠拓展正常人的智能。不過,要實現這一系列的發展,需要漫長的時間與持續的技術積累。
在這個過程中,我們不可避免地會面臨一些問題。一方面,倫理道德問題會逐漸凸顯,比如如何确保技術應用的公平性、安全性以及對人類尊嚴的尊重等。
另一方面,還會涉及到未來矽基生命(以矽為基礎的智能機器)與碳基生命(人類等以碳為基礎的生命形式)如何共存的問題。因為這些技術不再是與人類無關的外在事物,而是會與人類更加緊密地連接在一起,深刻影響人類的生活與發展。
張小珺:我們有可能在有生之年把自己的生命留給矽基世界,對嗎?
張亞勤:這是有可能的。這裡面既包含哲學層面的思考,也涉及到信仰範疇的問題,我堅信這種可能性是存在的。
就目前而言,我并不覺得人工智能已經能夠產生意識。然而,我認為矽基生命與碳基生命相互連接是切實可行的。通過這種連接,有望讓人類變得更加聰慧、更加健康,并且延長人類的壽命。
是不是會永生我不知道。但是肯定壽命會更長。
張小珺:壽命長是矽基的長,不是碳基的長?
張亞勤:它可以延長碳基生命。
張小珺:這是怎麼做到的?
張亞勤:比如說,未來或許我們的器官都能夠進行替換,大腦也能通過各種技術手段變得更為健康。當下,許多人離世是因為癌症,還有老年期的精神疾病等這些老年病症。但我堅信,假以時日,不管是依靠藥物治療,還是借助其他先進的醫療技術,這些疾病都有被治愈的可能。
不過,對于人工智能會自行產生自我意識,或是所謂全新的靈魂,我對此持否定态度。
張小珺:為什麼你不相信?——它聰明到一定程度,不應該能產生意識嗎?
張亞勤:因為人類意識是如何產生的,我們都不知道,因此我認為這更多是信仰問題。
但我們現在人已經有意識了,我們加了個東西,對吧?這個東西讓我們變得更聰明、更健康、生命更長,這個是有可能的。
張小珺:去年我采訪以太坊的聯合創始人VitalikButerin,他講了一個觀點挺有意思。他說未來生物和矽的技術會合并在一起。他認為這是我們人類唯一可以參與的Super-intelligence(超級智能)。否則,就是一個單獨的計算機,比我們都聰明,主宰這個世界。
張亞勤:這是另一個話題了。我想說的是,未來将會實現數字、物理與生物的融合,并且矽基和碳基也定會走向融合。但具有意識的,依舊是我們碳基生命。
這是目前我們對碳基意識的理解。就矽基而言,即便擁有再多的算力與海量的數據,本質上與意識并無關聯。或者說,我們無法創造出自己尚未理解的事物,亦或是對于不了解的東西,我們無從創造。
到底未來人類會怎麼樣?我認為未來會有一個新的物種。這個新物種雖仍處于人類的掌控之下,但其智能化程度極高,能力也極為強大。它将是人類的一種延伸,然而終究是一個全新的物種。
回顧3萬年前的人類,你會覺得那和現在的人類是同一物種嗎?我覺得差異極大。3萬年前的山頂洞人,屬于猿人階段,那時人類雖已開始使用工具,石器時代也有了火,但工具極為原始。如今,我們擁有手機、電腦與互聯網。倘若再過100年,後人看我們現今的手機、互聯網以及個人電腦,或許就如同我們看待3萬年前的火與石器一般。而且,這種進化的速度正變得愈發迅速。
人類的進化速度相當有趣。從狩獵時代步入農業社會後,在這2000-3000年間,人類整體的生活方式并無太大改變。但我認為,真正意義上的重大變革發生在過去的300年間,也就是工業革命之後。首先,人類掌握了能源,從而獲得了強大的動力。其次,信息社會的到來,又帶來了另一次巨大轉變。而現在,人類正經歷着智力的快速拓展。
所以說,自蒸汽機誕生之後,人類的進化便不再遵循達爾文所描述的自然進化模式。如今的進化是非線性的,呈現出指數型增長,速度迅猛。故而我覺得,或許只需30年,至多100年,那時再看今天的人類,當下的這些事物都會顯得極為簡單。
到那時,新的物種會比現在的人類聰慧得多。但它依舊由人類掌控,受我們的意識支配。
張小珺:它是矽和碳結合的,它可能不是只是碳?因為靠碳基我覺得很難實現30年更換一個物種。
張亞勤:這就得看你如何定義"物種"了。就好比如今你看猿人,會思考他們算不算新物種呢?其實從某種角度講算,可又和我們現在的人類截然不同,對吧?
如今時代發展迅速,不需要像過去那樣歷經3萬年,也許短短30年,最多100年,就會演變出一種全新的形态。
張小珺:能不能構想一下10年後我們的社會會是什麼樣?
張亞勤:10年之後,我們現在想象的好多東西實現就實現了,路上就會很多車就是無人的了,對吧?
會看到很多車無人駕駛的汽車,很多機器人。選擇親自開車的人會大幅減少,不少人會摒棄自行駕車的方式。
就像現在,大城市裡的很多年輕人就選擇不買車,他們覺得使用優步出行更為便捷。到那時,或許更多人會選擇不再自己開車。
30年之後你看到有個人開車,像現在有人開馬車一樣,變成新奇的東西了。你現在去紐約,紐約現在還有馬車,你去看紐約趕個馬車挺新奇的。
30年之後,你看到個人開車就是這樣的。以後可能人開車需要特殊批準。30年前電梯裡面還要坐人的,有人幫你運營的,現在你看電梯裡有沒有人?沒有人,但我後來發現在英國電梯,它對于這種服務,你看上去就很新鮮的這種。
張小珺:這是一個高端服務。
張亞勤:沒錯,所以到最後,親自開車說不定反而會變成一種極為特殊的場景。
可以預見,會有大量機器人真正走進千家萬戶。我想,每個家庭都會擁有一個機器人,就如同如今冰箱、電視一樣普及。這種機器人能夠承擔起家庭安保職責,當你不在家時,它可以查看窗戶是否關好,留意是否有外人闖入。
張小珺:可能以後買車的錢就花在買機器人上,是嗎?
張亞勤:對。我覺得這些都會實現的,包括教育、醫療等領網域也都會有徹底改變。AIR現在就在做AIHospital無人醫院。
我們當下所做的諸多嘗試,未來大多會變為現實。
不過,人類自身并不會發生根本性的轉變。我預計,30年後人類的壽命将會大幅延長。30年的時間,雖不太可能實現永生,但活到100歲或許會成為普遍現象,甚至有些人能夠活到120歲,乃至150歲。
張小珺:這會帶來社會結構性的變化嗎?能推演嗎?
張亞勤:這一點我雖無法确切預知,但我認為它必将引發社會結構的一些變化。
比如說,未來人們的工作時長會越來越短。在工業革命剛剛結束的時候,我們每周要工作7天,後來變成了6天。我出國那段時間,國内還是每周工作6天,等回來就變成5天了。現在歐洲一些地方已經實行每周工作4天,照這樣發展下去,以後人們說不定一周只需工作1天。
一周僅工作1天,其餘時間人們就可以去做自己感興趣的事。這裡要說明的是,這并非意味着部分人工作7天,而其他人失業,致使6個人沒工作。
我的意思是,随着社會生產力的大幅提升,社會結構發生改變,人類社會會步入老齡化,人均壽命增長,自然出生率則會降低。由于人均壽命延長,人口總數可能不會減少,但新生兒數量會下降,這已然成為一種大趨勢。
留意觀察,你會發現相對發達的國家人口都在呈減少态勢。目前人類的平均壽命中位數大概是多少呢?現在是40歲,而以後可能會達到80歲。所以到那時,80歲的人或許還算是青年人或壯年人,一切都會發生改變。
并且,未來老年人的身體狀況可能也會相當良好,因為不管是身體上的疾病,還是腦部的疾病,都會逐漸被攻克治愈。
張小珺:所以,應該盡早找到自己喜歡幹的事,要不然怎麼度過這麼漫長的人生。
你會給現在的年輕人什麼樣的建議嗎?你會告訴他們現在科技發生了什麼樣的變化,教育會發生什麼樣的變化,你們應該怎麼應對?
張亞勤:我提議,今後每堂課除了配備一位人類教授,還應增設一位AI教授。這位AI教授就如同助手一般,但它所掌握的知識或許遠比人類教授更為豐富。學生不僅能夠與它互動交流,還能向它請教問題。在未來,學習的關鍵方式并非死記硬背或大量刷題,而是學會如何提出高質量的問題。
就拿現在的ChatGPT來說,它給出的回答質量,與你提問的水平緊密相關。要是你随意提問,它可能就敷衍作答。但要是你問得精妙,它便會給出深入的回答,與你展開有深度的互動。
一直以來,我們都在強調提問的能力,倡導批判性學習,鼓勵學生進行辯論,形成自己獨特的新觀點,而這些在未來會變得愈發重要。
張小珺:最後,基于你所有讀過的書,能不能推薦兩本書?
張亞勤:我剛看了一本書叫《Outlive》(《超越百歲:長壽的科學與藝術》),我覺得特别好。剛才我們提到了AI在生命科學領網域的應用,這本書就涉及到長壽生活方式的相關内容。
之前我還讀過一本老書,叫《InSearchofMemory》(《追尋記憶的痕迹》),講的也是相關主題。我還專門向這本書的作者,諾貝爾獎得主哥倫比亞EricKandel教授請教過,那位老先生如今人在美國,已經100歲高齡了。在人類所具備的各種智能當中,記憶力占據着極為重要的位置。
記憶抽成幾個層次,有天生DNA的記憶,有短期的記憶,有長期的記憶。學習的過程,實際上就是如何将知識轉化為記憶的過程。比如知識,要存儲到大腦外皮層形成長期記憶,才算是真正掌握了知識。目前,AI在這方面的理解還很欠缺。這本書對人類如何記憶以及AI對知識的抽象化處理,闡述得十分精妙。
例如,患上失憶症,或者阿爾茨海默病、亨廷頓病等的老年人,往往會發現他們大腦中負責記憶的區網域,像海馬體開始縮小、萎縮。一旦出現這種情況,人的所謂智能就會随之減退。
可見,記憶體尤為關鍵,然而目前AI在記憶方面的表現仍不盡人意。