今天小編分享的互聯網經驗:AI之後的下一個風口:量子計算與它的Transformer時刻,歡迎閱讀。
文 | 矽谷101
"先進半導體是傳奇的過去,AI是蓬勃的當下,量子計算是不可避免的未來。"
曾長期被視為"未來技術"的量子計算正在加速從實驗室走向現實。2月11日,量子計算公司QuEra宣布獲得2.3億美元投資,這是量子計算領網域迄今最大的單筆投資之一。
這家從哈佛大學和麻省理工學院分拆出來的公司,使用原子和激光來制造量子比特,此前這種技術被認為誤差過高,但與谷歌、IBM等巨頭采用的超導電路和離子阱路線相比,這種中性原子技術不需要超導電路,具有穩定性高、無需笨重制冷系統等優勢。
就在三個月前,谷歌宣布基于Willow芯片的新一代量子計算機僅需不到5分鍾就完成了一項傳統計算機需要"10的25次方"年才能算完的标準數學運算,并且克服了高錯誤率的難題。這一突破被業界稱為量子計算的"Transformer時刻"。
然而,行業内對真正實現"有用的量子計算"的時間存在不同的預測。英偉達CEO黃仁勳預測,量子計算的大規模商業應用至少需要二十年,而谷歌的目标是五年内推出可用的量子計算服務。
本期矽谷101,主理人泓君邀請到Roger Luo,Anyon Technologies 創始人兼CEO,加州理工博士與伯克利大學的博士後,和Jared Ren(任恒江),Anyon Technologies 創始人兼CTO,加州理工博士與博士後深一起讨論黃仁勳關于量子計算的時間預測,谷歌Willow芯片的重要性,矽谷公司在量子計算領網域的布局和技術路徑,以及它将如何影響加密貨币、銀行體系,以及整個密碼學領網域。
以下是部分訪談精選
01 理解量子計算,量子比特的疊加态與糾纏态
泓君:我們或許可以先從一個通識性的問題入手。能否用盡可能通俗的語言向聽眾解釋一下,什麼是量子計算?它是用來做什麼的?
Jared: 理解量子計算可以用經典計算機來做類比。我們現在市面上幾乎所有的計算設備——無論是CPU、GPU、手機,還是簡單的計算器——本質上都屬于經典計算機。
我們可以把經典計算機理解為一長串由 0 和 1 組成的字元串,也就是所謂的 比特(bit)。比特只能處于 0 或 1 的狀态,而所有計算,無論設備多復雜或多簡單,本質上都是在處理這些 0 和 1 組成的字元串。類比于量子計算器的話,它也是一長串的字元串,不過它的基本單元是 量子比特(qubit)。
那量子比特跟比特的區别是什麼呢?區别在于,它不僅可以是 0 或 1,還可以同時處于 0 和 1 之間的 疊加态。也就是說,量子比特可以在多個狀态之間共存,而不像經典比特那樣只能在 0 和 1 之間二選一。
來源: devopedia.org
量子比特還有另外一個特性,那就是量子的另外一個原理,也就是它的糾纏态。它不僅僅是說每一個量子比特是單獨的量子比特,而是不同的量子比特之間可以糾纏在一起,同時發生改變。這兩個一起發生作用,就產生了跟經典計算機顯著的不同。
經典計算機的狀态是由比特(bit)組成的,比如一個只有三位比特的經典計算機,它的所有可能狀态就是 000、001、010、011、100、101、110、111,總共有 8 種 可能的組合。如果想要進行運算的話,它只能一個一個地去改變每一個位數。如果它要去到這八個不同的狀态的話,要進行八次運算。
但量子計算機不同,如果有一個三個量子比特構成的量子計算機,由于疊加原理和糾纏原理,它可以同時存在在這八個狀态裡面,然後同時對這八個狀态進行計算。如果只有三位數的話,他們的差距可能不這麼明顯,一個要進行八次運算,一個進行一次運算就可以完成。
但是如果比特的數量繼續加倍的話,那量子計算機它其實是一個指數增長的過程。如果有四位的話,經典計算機就要進行16次計算才能窮盡16個狀态,但是量子計算機還是只需要一次就可以窮盡所有的16次狀态,這就是所謂的量子計算機相對于經典計算機的計算來說的話指數的加速過程。
泓君:我可不可以理解成量子計算機非常适合去解決復雜高難度的計算,越難的計算它越有優勢。
Jared: 我們可以理解為它的核心優勢在于能夠在某些特定的問題上實現指數級的加速。量子計算機它不是經典計算機的代替品,就像GPU不能像是完全是CPU的代替品一樣。他們兩個是共同存在、相互協同的作用。量子計算機特别擅長某些特定問題上實現指數級的加速,像是矩陣運算因數分解、量子化學、模拟和組合優化等領網域,它會在這些高復雜度計算的任務中發揮非常重要的作用。
泓君:哪些領網域會運用到這些高復雜度的計算?如果你們能想象未來量子計算的應用場景,它相比傳統計算機,最具優勢的場景和問題是什麼呢?能不能舉一個具體場景的例子。
Jared: 它有幾種特殊的算法。有的特殊算法對矩陣運算有特别好的指數級的加速效果,有的運算對因數分解有特别好的加速效果。這個世界本身是量子的,用經典計算機對量子世界進行模拟本身是非常困難的。比如一些化學運算,它本身是量子的,所以用量子計算機進行這方面的運算将會更加容易。我剛才提到的三個例子所對應的其實就非常明顯,我們現在所有的人工智能學習,本質上就是矩陣運算。
因式分解的話,能想到的就是Shor算法(Shor's algorithm) 所對應的安全問題、加密問題。現在大部分的加密手段都是通過類似的情況進行加密的,那量子計算對于破解這樣的加密就非常有優勢。
量子化學模拟很明顯就可以想到油氣、化工、藥物的研發等等,是一個非常直接的作用。
還有一個領網域就是量子計算機對組合優化的求解過程是非常的迅速,也有指數級的加速作用。所以說對于一些物流之類的需要優化的内容,這些領網域也是非常有幫助的。
泓君:剛剛提到了好幾個點,比如說在矩陣運算方面,它對人工智能的加速表現在哪裡?比如說有了量子計算機,大家再去訓練大模型的時候,它會有特别的優勢嗎?還是說它只能在一個極小的領網域裡面,針對某一個特定問題,可能會有一些特定的解法。
Jared: 我理解的是人工智能無論模型是什麼,它的本質是矩陣運算。這就回到了根本的問題:為什麼GPU比CPU在處理人工智能模型時的速度快這麼多?
本質上就是GPU對矩陣運算的速度會比CPU快很多。CPU擅長比較復雜的問題和比較少線程的運算,而矩陣的運算不需要特别復雜和重復的過程,而需要特别多的核心同步運算,這就是GPU的作用。所以在人工智能上,GPU上比CPU上優勢更大,就是因為GPU對矩陣運算會比CPU快很多。
像量子計算機中用到了HHL(Harrow-Hassidim-Lloyd)之類的算法,對矩陣的運算也能加速的話,可以類比為人工智能大模型的開發,實現了從CPU到GPU的這樣一種跨越式的加速發展。
來源:yanwarfauziaviandi.com
Roger: 量子計算在這個具體的問題上,通過加速矩陣求逆算法相關的算法,可以總體加速整個人工智能學習和inference(推理)的進度。比如說一個模型有1000億的參數,你用GPU去跑的話,對應的大概是1000億乘以1000億的算法復雜度。對于量子計算機來說,就是一個求指數底數的方式,相當于log 1000億的復雜度。相對來說在處理巨大的模型的時候,它的操作數量會指數級下降,那可以以更少的能量和資源付出計算一個巨型模型。
02 明貶暗捧的英偉達:表面保守預測,暗地快速布局
泓君:量子計算現在到底能不能實現,比如說我們說的訓練人工智能,這個能力發展到哪個階段了?這個問題是由英偉達的創始人黃仁勳在今年的CES上提出來的。我記得他說,如果說十五年内能實現"非常有用"的量子計算,他覺得這個是一個非常偏早的預測;如果說是三十年時間,又可能偏穩,所以他覺得一個合理的區間是在二十年。但是他這個話一說,有一批量子計算股票的股價就紛紛下跌。所以也是想聽一下兩位,你們怎麼去看黃仁勳說的量子計算的實現時間。
Roger: 首先黃仁勳在NVIDIA的投資者會議上也被問到了,他正面回答了這個問題, 已經把這個時間說到了遠不止二十年了。
因為一旦在這種會議上開始回答這個問題,就意味着投資者會考慮是否要将量子計算在未來十年對公司股價的影響計入定價(price in)。眾所周知,華爾街計算股價時會将未來十年的預期增長(assumed growth)和壟斷地位(monopoly)計入定價。
所以這對他來說實際上存在利益衝突。如果他表現出量子計算在未來十年可能會對 GPU 產生影響,那麼第二天英偉達的股價就會下跌。相比讓英偉達股價要跌來說的話,那量子計算的股價跌對他來說是一個非常合理的決定,畢竟坐在哪個位置上回答哪樣的問題。
從另一個角度來看,我很尊敬黃仁勳,他确實是位很厲害的人物。但是不要只看他說什麼,要看他做什麼。英偉達在量子計算領網域已經是一條大魚了,他們也是我們的合作夥伴。他們在各個方面都表現得非常主動,包括我們即将參加的超算會議,我們還要一起做demo。所以整體上來說,這個就代表一個邏輯。
從他"做"的角度來看,我們可以回顧一下歷史。CUDA 發布于 2007 年,CUDA DNN 發布于 2014 年,Transformer 發布于 2016 年,GPT-3.5 則是在 2022 年。即使從 CUDA 算起,從英偉達開始布局這個方向到技術完全落地,總共也不過十五年時間。
從邏輯上講,在 21 世紀的技術發展速度下,如果一項技術還需要十五年才能成熟,那我可能連它一半的發展歷程都沒聽說過。所以任何需要二十年才能實現的技術都不太現實,至少納斯達克市值前三的公司 CEO 不太可能正面回應這種長期技術,更不用說讓公司正式參與其中,這個有點違背邏輯。當然,還是那句話,他做什麼比他說什麼更重要,因為他"說"什麼要考慮二級市場的影響,他自己也有英偉達的股票的利益。
第三點,他用詞非常精準,說的是"very useful quantum computer",在這個語境下,這可以理解為"Large-scale fault-tolerant quantum computer(大規模容錯量子計算機)",也就是量子計算的最終形态。這有點類似于 AI 領網域中我們讨論的 AGI (通用人工智能),是一個非常長遠的目标。如果它能夠實現,基本上就會重新定義人類文明的下一個階段,因為我們将能夠開發出無數新材料,以及可能出現遠超人類能力的人工智能系統。
所以他這個"very useful"的意思就是量子計算徹底站在了當下GPU所處的核心位置,這個的确我個人不認為在十五年之内有比較大的概率能出現。我覺得工業界共識來說,就是Large-scale fault-tolerant quantum computer(大規模容錯量子計算機)這種處在壟斷階段的量子計算,可能也要十五年的時間。我覺得他的說法本質上沒有偏離他們自己公司内部調研和工業界的公式。他只是把它講成了一個可能投資者聽起來會更加友好的說法。
泓君:是不是可以這樣理解:如果量子計算真的實現了,它可能不需要那麼多 GPU 就能完成運算,所以對 GPU 和芯片的需求會減少?我想知道這對 NVIDIA 股價的衝擊,以及大家是怎麼思考這個邏輯的。
Roger:對,NVIDIA 現在将自己定位為"a supercomputer infrastructure company"(超級計算機基礎設施公司)。他們認為未來的超級計算(supercomputing)将涵蓋 AI、天氣預報,以及化學模拟等高復雜度的計算問題。從他們的角度來看,這将是未來的核心業務。但有趣的是,量子計算(Quantum Computing)也是這麼說的。
但實際上,量子計算在一定程度上确實會侵蝕,或者說參與英偉達在復雜運算領網域的市場份額。比如在進行極其復雜的蛋白質反應模拟時,不是像 AlphaFold 那樣的預測,而是用第一性原理進行模拟,精準地發現新藥。對于這類任務,英偉達去算顯然是不現實的。
泓君:對公司來說,成本太高了。
Roger:如果有個中心願意買100萬個NVIDIA未來的GPU芯片去算這個問題,對他們來說股價肯定是好的。但這個時候如果量子計算給到一個預期,說不需要100萬個GPU,差不多1萬個GPU就能實現這些目标。這個相當于它的市場就得不到了,就是說你的量子計算任務基本上不需要跟GPU分擔工作量,就能完整的去處理這些復雜的問題。
所以我覺得黃仁勳把量子計算放到十五年二十年這個時間段,相當于是告訴華爾街不要将未來的不确定性計入當前定價。從 NVIDIA 的角度來看,未來十年計算需求會持續上升,公司的股價應該是水漲船高,這個邏輯是合理的。
在未來十年,量子計算本身也需要 GPU 來做混合量子計算,這也是為什麼我們要跟英偉合作。所以,未來十到十五年其實是一個共同存在、共同增長的階段,并不存在誰取代誰的問題。嚴格來說,這是一個增量市場的擴展,而不是存量市場裡相互争奪份額的競争。
泓君:你們跟英偉達的合作是什麼樣的?
Roger:我們更加重視的是產品和技術層面,作為一家硬體公司,我們主要關注兩個方向。
首先是利用 GPU 的軟體系統和算法來優化量子計算機的芯片設計和量子測控,以及使用 GPU 來優化量子計算機的運行。其次是通過量子計算機結合 GPU 來增強 AI 模型的泛化能力(generalizability),即使用更少的參數(parameters)和數據(data)來訓練出具有更強泛化性的 AI 模型。這就是所謂的量子增強 AI (quantum-enhanced AI)路徑。
大家也聽到有一些非常知名的AI公司,最近也在招募量子機器學習的人才去做相應的開發。其實這也是一個趨勢。比如大家聽說過的SSI(Safe Super Intelligence),Ilya的那家公司。另一方面,我們和他們的合作當然不是在軟體層面,而是更側重于構建計算平台。
從另一個角度看,我們與英偉達的合作不在軟體層面,而是在構建計算平台。我們将他們的 CUDA Quantum 軟體作為膠水,把他們的 GPU 和我們的 QPU (量子處理器)黏合成一個完整的量子計算平台。通過高速直接互聯,我們讓量子處理器和 GPU 能夠進行實時數據互動,從而增強計算能力。在量子計算機運行的同時,還可以提升它在人工智能學習等領網域的解決方案。
相當于在這個體系中,我們在英偉達的生态系統中被定位為"quantum backend provider"(量子後端提供商)。他們自稱為"GPU and backend provider"(GPU 和後端提供商),所以我們實際上是一種并行關系,同時把它變成一個完整的量子增強計算平台。我們是有自己的量子芯片,有自己完整的量子計算機,只是将我們的量子計算機跟NVIDIA的GPU系統進行了一個互聯,然後用他們的軟體去協同兩邊的工作,通過量子硬體去增強GPU在人工智能學習問題中的一些作用。
泓君:你們的芯片是自己造的,還是市場上有專門針對量子計算設計的芯片?
Roger:這個問題很好,我們的芯片是我們自己造的,因為我們自己的獨立的設計和專利和制程。但是實際上有公司在賣量子芯片,好不好我不評價。但是基本上美國的公司都是自己造芯片。或者這麼說,很多技術要在一個快車道的計算面進行突破,如果你這麼早的就給到一些可能并沒有那樣技術積累的團隊去給造芯片,是有點不算明智的。
03 Willow芯片與量子計算的"Transformer時刻"
泓君:你怎麼看谷歌新發的Willow芯片?
Roger:他們從2014年一直以來都在向這個方向走,就是公開路線圖,實現量子糾錯,證明這個可擴展性的情況下去實現黃仁勳口中的"very useful quantum computer",這是他們一直以來的目标。
為什麼大家可能有點困惑,因為不同公司目标不太一樣。比如有些公司的目标就是AGI,而有些公司就像OpenAI一樣,能發布一個GPT3.5就認為可以了。
所以谷歌推出 Willow 這個芯片,作為 Sycamore 的繼任者,從我們的角度來看是個延續性工作。谷歌在 Sycamore 之前的一些demo中發現,無論是規模還是芯片性能,Sycamore 都不足以真正驗證量子計算,特别是機遇量子糾錯計算的可擴展性。
要證明可擴展性,就意味着 "The more, the better" ,也就是芯片造得越來越大,計算機的可靠性和計算能力應該越強。以前我們的實驗發現,當你芯片造得越大,整體性能并不會相應提升,原因是總體錯誤率也會上升。
所以要把量子計算機做到所謂的"very useful quantum computer",量子糾錯成為了一個至關重要的前置技術。所以Willow相當于是谷歌基于過去十年的發展,終于證明了量子計算加上糾錯機制的可擴展性。
泓君:Willow芯片是在一個什麼樣的階段?開始制造了嗎?
Roger:是的,他們也有論文了。他們用的不是全世界最領先的量子比特和保真度,但是加上各種工程提升,讓這個芯片做到了能驗證量子計算在硬體層面,在實驗實現上的一個可擴展性。
這一點我要強調實驗的可擴展性。因為量子計算本身能做到復雜超級計算,這個本身不是個問題。從算法層面,從原理層面,大概十幾二十年就搞得很清楚了。過去十年谷歌、IBM和整個工業界幹了什麼事兒呢?就是從實驗、物理可實現的設備層面去證明這一點,證明我們真正能做出一個足夠理想化的芯片去做到可擴展性,做到大規模運算。所以谷歌 Willow芯片的意義就在于從實際的物理層面把它做出來。
泓君:他會開放給第三方的合作夥伴采購嗎?還是他們只自己用。
Roger:谷歌從來都不是個硬體公司,從來都不靠賣硬體。所以他們最早做出的TPU也沒有賣,基本上都是自己用。對他們來說,這就是這是一個非常好的驗證,能做到就是在十年内做到所謂的"very useful quantum computer"的一個階段證明。
泓君:那你覺得它的芯片造出來了,會加速整個量子計算的研究嗎?
Roger:從加速層面來說的話,肯定會的。但是更多來說就是他們證明了能做出來。這個情況下來說,就能促使他們這個隸屬于谷歌 AI的部門獲得更多的資源,将芯片做的越來越大,越來越能解決一些實際問題。
所以加速層面不是說用這個芯片加速他們别的發展,而是用這個芯片去作為一個活生生的證明,然後去獲得更多的資源,把這個東西擴大到成為一個商業化,或者成為一個"very useful quantum computer"的形态。加速肯定會加速的,因為管理層現在被說服了。
泓君:被說服了什麼?就是效果是ok的。
Roger:谷歌 CEO也發了帖子,因為管理層需要看到這個概念得到驗證。當你說你可以擴展(scale),那就擴展給我看。現在從谷歌管理層的角度來看,這種可擴展性(scalability)在基礎層面已經得到了驗證。
這有點類似于 Transformer moment:你證明你的機器學習模型可以擴展,然後通過擴展到足夠大的規模,看能不能做出類似 GPT 這樣的模型。
泓君:所以Willow芯片相當于量子計算界的Transformer moment。
Roger:對,我這有點拾人牙慧了。因為是有一個投資人問過我,這是不是Transformer moment,我想了想好像有點像。因為的确是谷歌做出了一個活生生的驗證,這玩意能擴展(scale),那好的我們就來擴展它。如果從AI的路徑上來說的話,實際上我更加樂觀地認為就是未來十年以内的事情,我對黃仁勳的這個評價覺得有點過于保守。
泓君:你的估計比黃仁勳的這個估計更樂觀, 而且尤其是在谷歌的Willow芯片發布以後,你覺得它對真正實現的非常有用的量子計算,它能夠加速到多少年?比如說沒有這個芯片跟有了這個芯片的本質區别是什麼?
Roger:其實我覺得如果沒有這個芯片的話,大家會更加傾向于像黃仁勳的預測,大概十五到二十年。但是有這個活生生的驗證後,大家對未來時間線收斂的預測會縮短到十五年以内。當然這個可能也是為什麼他會在這個會議上被投資人正式地問到這個問題,因為他們就要開始考慮是不是要将這個事情考慮在股價定價裡。
泓君:關于Willow芯片,之前提到它解決的是量子糾錯在實驗實現的可擴展性。能不能解釋一下,它解決了量子計算中哪一個最核心的問題,它的原理是什麼?
Jared:我大概談一下量子糾錯的基本原理。我們知道量子計算的使用最大的障礙之一就是噪音。同樣也可以用經典計算機來類比量子計算機中的噪音。
所謂的經典計算機也是噪音非常嚴重的。現在我們正常的使用日常生活中的電子產品、手機、電腦,不會感受到這些噪音,是因為他們在很早以前就有底層的經典領網域的糾錯算法,已經在硬體和軟體的銜接層面把這些噪音或者說錯誤給糾錯了。
來源:Q-CTRL
打個比方,在GPU中,如果有一個1.2伏特的GPU,那理想情況下1.2伏就代表邏輯1,然後0伏就代表邏輯0。但是在實際操作中,由于量產的GPU芯片不可能是完全一樣的,每一次運算它所施加的電壓也是有一定的不同的。所以說這個電壓并不一定一直是1.2伏或者是0伏。不同的晶體管之間,不同的時間,不同的輸出會有不同,那計算機的底層就會把一個範圍内的誤差都算作0或者1。比如說出來一個1伏的電壓,那也會被認為是1.2伏,也就是邏輯1,那1.5伏也會歸類為邏輯1。這樣來說對經典計算機是一個相對比較簡單的糾錯過程。
但是回到量子計算中,這個就非常不一樣了。因為不像經典計算中,它可以達到1伏這樣相對來說比較大的一個數值,來方便進行糾錯。量子比特的能量是非常小的,像我們所用的超導系統中,它只有一個光子的能量。量子比特非常脆弱,也極易受到環境的幹擾和内部誤差的影響,從而導致量子信息的丢失。
還有一些跟經典比特之間的對比的例子,比如說經典比特只會出現0或者1的翻轉錯誤。而量子比特像之前描述的,它其實是一個疊加的狀态,不僅僅包括0和1的翻轉,它可能還會包括一些相位上的偏移的錯誤。這也會對計算結果或者計算過程造成噪音的影響。
由于量子比特有糾纏的特性,所以它不可以像經典計算中每個比特可以單獨拎出來進行糾錯。如果要對量子集團進行糾錯,需要對所有糾纏在一起的量子比特統一進行糾錯。這也就是為什麼量子糾錯會被認為是實現量子計算,然後推動量子計算真正走向實用化的一個核心技術。
泓君:所以谷歌的Willow芯片是極大地解決了這個問題。
Jared:我認為Willow用現在最主流的一個量子糾錯的方案,這個糾錯的方案叫做表面碼,也是源自于加州理工的量子糾錯的技術。通過利用表面碼的糾錯碼和比較優化的量子硬體,谷歌向世界證明了我們可以用這種方法,用這條以前已經規劃好的路線繼續走下去。
只要是按照這個路線繼續走下去,我們就能逐漸擴大量子計算機的規模和運算能力,而同時不會使錯誤率随着規模的更大而變得更加的嚴重,反而是随着規模的更加擴大,它的錯誤率反而是下降的,也就是說計算能力整體是提升的。按照我們這條路線繼續走下去,最終我們是可以實現像剛才描述的非常有用的量子計算。也就是我們業内人士叫的叫做完全糾錯的量子計算機。
04 科技巨頭的路徑之争
泓君:大家覺得谷歌有了這個芯片以後——剛剛你們也提到了,其實你們之前也是跟亞馬遜有過這樣的工作交集——它會對其他做量子計算的公司形成顯著優勢嗎?比如說 IBM、微軟、亞馬遜、英特爾,還有一些創新型公司如 D-Wave、IonQ 和 Rigetti。
Roger:從這個層面來說,谷歌其實是一個很好的公司。為什麼呢?因為他們首先有願景,願意花費早期的時間和精力,像發明Transformer那樣,給大家證明這個大方向是對的,然後大家就可以沿着這個路子走下去,相當于掃清了很多不确定性。
我們可以看一下其他大公司的回應。比如說IBM以前從來沒有把量子糾錯放在他們的路線圖裡面,至少沒有明确放過,但在前幾個月卻放上去了。因為谷歌這個東西也不是立刻出來的,說實話我們内部早就能看到論文了,因為這些都是需要同行評議的,大家都能看到。
泓君:所以論文它只要發出來,它就開源了,大家可能都知道這個方法了。
Roger:首先,谷歌的路線圖一直是明牌。他們要通過scale和量子糾錯算法來實現目标。這個算法來自于Caltech,叫做表面碼(surface code),是由Caltech的Alexei Kitaev發明的糾錯算法。
硬體公司與軟體公司有一個很大的不同點:在硬體領網域,我可以把物理過程(physical process)這個大方向指清楚,因為具體的物理實現在哪裡都是一樣的,這樣大家就可以根據這個大方向去努力。IBM之所以不放棄,是因為它認為量子糾錯的實現時間線會拉得更長。它認為通過暴力增加量子比特數量的方式,能夠更早地實現商業價值,或者實現所謂的"very useful quantum computer"。
換一個角度來說,為什麼IBM作為這個行業最早的參與者,在這方面反而顯得有點保守?這是因為大公司往往傾向于更保守,更堅定地遵循其早期路線圖。IBM之前更多地在思考如何用現有的、不需要糾錯的技術就能做出有用的應用,這是它的路徑。所以它不停地在探索商業化途徑 - 雖然在做技術,但也在做商業化。相比之下,谷歌完全不做商業化,專門去做糾錯。
IBM的策略已經經歷了幾次演變。現在大家都知道,IBM認為量子糾錯是可行的,因為這方面的改進是可以實現的。而且關鍵是谷歌的團隊比IBM的人員要少得多。所以IBM就一直在做這些事情。作為行業先鋒,有時候年輕企業反而比它更有效率。比如另外一家大公司(因為這是非公開信息,我就不具體說是哪家),也在把自己的路線圖轉向量子糾錯,要對标谷歌。一看到其他大公司取得突破,他們也想突然倒戈,轉向這個方向。因為他們以前認為可能要很晚才能做出東西,但現在做的反而是最早的。
D-wave 有點難,因為他們的路徑一直是做量子退火計算,這就意味着他們的路徑是跟量子糾錯完全是背道而馳的。但是也有歷史原因,為什麼D-wave是最早的純量子計算公司?說實話,在那個年代大家認為可編程通用計算機是不存在的,所謂的數字計算機是不存在的,或者很難造出來的。
所以他們的公司創始初衷就是通過簡單易實現的退火量子計算去做專一化的量子計算機,它不能被用來編程來做所謂的量子糾錯,也不能通過編程去做通用量子算法。但是他們認為通過做專業化的量子計算機可以更早的實現商業化價值。現在回頭看,這是一個錯誤的選擇。
泓君:你不認可這條路線?那他們現在有轉變嗎?
Roger:他們公司的創始到現在都是走量子退火方向,所以他們要轉變也是要有過程的,相當于要徹底換方向了。我不是完全不認可,他們也許能找到很多使用案例,但是會發現之前認為很難實現的量子計算的路徑,反而現在可能更早實現,而且關鍵實現之後的影響還更大。
泓君:所以糾錯現在看起來是一個比較主流,更受大家認可的方向?
Roger:對,因為已經做出來了,活生生的例子也擺在那裡了。就像黃仁勳或者說很多人說張口閉口就是什麼要十五年、二十年、三十年。但是大家仔細想一想,有什麼技術人類開發了十幾、二十年,或者說到現在這個階段還要開發十幾二十年的?
泓君:可控核聚變?
Roger:可控核聚變它本質上并不完全是個技術實驗問題。因為想當年人類做核物理,從證明做出了第一個裂變反應,就真的只是做了一個實驗室的很小規模,裂變反應是分下來幾個原子彈的規模,到最後產生一個兩代產品直接"落地",字面意義的"落地",用了三年的時間,再跨越一個世代,用了可能不到十年的時間。
所以實際上會發現可控核聚變,本質上它在市場需求上并不是那麼迫切,因為人類有大量的可裂變反應堆可以用。說白了一定要用的話,還有氫彈可以用,其實也是可以發電的,蘇聯有相關的方案。如果要實現可控核聚變的話,那是一個非常優雅且非常理想的目标。但是坦率來說,ROI可能還沒有把第一遍做大點高,就人類現在的能量需求的話。所以我覺得如果還要幾十年的話,這種技術大概率已經前置成熟了。
比如說核聚變,已經有氫彈了,所以聚變這個反應其實已經落地了,它相當于是第二代或者更先進的改進過程。如果是量子計算,我們談的更多是第一代落地的本身。我覺得并不存在有這樣的技術是還要十幾二十年去做出來的。
來源:ResearchGate
泓君:亞馬遜現在的路線是怎麼樣的?
Roger:他們做的是一種比較新穎的超導量子比特來進行scale。
所有大公司都做超導量子比特,包括谷歌、IBM、亞馬遜,只是不同的超導量子比特。從公開信息來說,亞馬遜做的是一種比較新的超導量子比特,叫Cat Qubit(貓量子比特), 但是谷歌顯然是產生了(更大的)影響。
泓君:微軟呢?
Roger:微軟當年覺得量子計算很遙遠,他們其實開始的很早,應該不比谷歌晚,但是他們走的一個是叫拓撲量子比特的路子,就是一個完全到現在為止都沒有能證明的東西,他們八成已經放棄了。
所以他們現在更多的是想去做跟别的量子計算公司進行深度合作。比如說他們現在之前跟Honeywell的分拆公司叫做Quantinuum合作了所謂的邏輯量子比特計算。最近又跟UC Berkeley的一個分拆公司做基于原子的邏輯量子比特計算。
微軟其實一開始也很像谷歌一樣重視容錯量子計算,谷歌其實更保守。谷歌為什麼選超導量子的路線?因為這個工程上早就被證明,你可以真的是把芯片造出來能用。所以說從公司層面上來說的話,實際上你只需要對它進行所謂的工程優化,就可以慢慢去產出成果。
至于快和慢,很多時候跟你的投入和市場需求有直接挂鉤的關系。就像剛剛說的曼哈頓計劃的例子,市場有巨大的需求,那這三年就能交付了。如果市場需求需要等待時機或者證明商業上的合理性的話,那就可能會拖得長一點。但是總體上來說,用超導路徑你是可以直接把它給預期做出來的。微軟當時就覺得這條路子可能都要走個十幾二十年。
就像我說的,最早是大家的對未來的估算都容易有分歧,很容易就會說三十年之後,所以他們選了一個叫拓撲量子比特,這種拓撲比特的好處就是上來就容錯。他也對應的開發了很多軟體,算是比較早的量子軟體開發公司。
現在硬體廢了之後,他們就把軟體跟别的量子計算公司進行合作,在别的量子硬體上的運行邏輯量子比特。所以實際上它跟谷歌很像,也很重視所謂的容錯量子計算。只是最後實現路徑的時候,谷歌其實選擇一條硬體上更能證實的方式去軟硬結合的去做這個事情。而微軟因為決策上的一些失誤,所以現在只有軟體了,跟硬體公司合作。
泓君:所以整個過程大家對技術方向的把控還是需要一些關鍵決策的。還有幾家創業公司呢?比如說IonQ?
Roger:IonQ的路徑主要是離子阱。離子阱路徑其實曾經很長一段時間,甚至在10年以前,被認為是比超導更有前景的路徑。因為基于離子阱的量子實驗其實是人類最早的量子實驗,拿了不少諾貝爾獎。
超導在很長的時間,在2007年—09年之前被認為是一個非常差的平台。因為當時實驗上做出來量子比特都非常差。大概在2009年,耶魯的研究員開始把量子比特做得越來越好了。然後到了2014年的時候,可以到了糾錯的阈值,也是谷歌參加的一個時間點。
IonQ他們路徑為什麼最好呢?因為這套量子體系是歷史最久的,在小規模量的體系裡面是最好的操縱的,可動性很強。所以說他們當時的路徑就認為離子阱這個路線可能會更早的實現所謂的商業落地和"very useful quantum computer"。但是事實來說,他們公司從創始到上市到現在,量子比特的數量可能就翻了一個倍。
泓君:現在是多少個量子比特?
Roger:他們2017年創始的時候,因為是學校出來的,所以從大學實驗室搬的那套就有11個量子比特可以相互糾纏和計算了,當年發了很多論文,其實都還不錯的工作。但是後來發現離子阱這個路徑,當你要超越11個量子比特的時候,工程上面有巨大量的科學調整。一個是工程挑戰大家都很大,但是你可以一步一步去實現它,一個是有科學挑戰。
泓君:科學挑戰會更難,它需要依靠基礎的突破。
Roger:就是有更多的不确定性在裡面,你需要有更多的創新去驅動他們。
泓君:所以你剛剛說他們翻了一個倍,現在是22個量子比特。
Roger:差不多,在二十多個到三十個之間。
泓君:現在業界最多的是多少個量子比特?
Roger:離子阱最多的應該是Honeywell的32個。但是現在的問題變成了當你的量子比特變多的情況下,其實他們的一個取舍就是現離子阱的性能越來越接近超導了。量子比特變多,它的運行性能,比如說保真度這些指标越來越接近超導了,應該說是超導越來越接近他們。導致一個很有趣的一個跨界,就是以前認為超導不可能做到保真度大于99.9的,現在能做到了。
技術發展其實是一個很有趣的過程,你會發現彎道超車在技術發展早期并不存在可能性。就像AI,怎麼從Transformer去到GPT,你不能為了避免用Transformer換一個完全不一樣的架構去試錯,對吧?很多人以為自己可以彎道超車的例子,反而翻車了。
泓君:這就是"彎道翻車"。
Roger:所以說IonQ的問題在于沒有一個清晰的路線去做到現在超導這種scale。他們會說我們有路線圖了,但是我們需要看到實際的展示。
泓君:Regetti呢?
Roger:Regetti這個公司很傳奇,Regetti本人就是當年在耶魯把第一個超導比特量子能做出來的人,就是他的畢業論文。然後他把這套帶到IBM,所以IBM最早的路徑圖就是根據他的那一套架構起來的。他後來自己開公司,反正各種原因,他的公司的超導比特的一些小細節也變了。
Regetti我覺得其實在量子公司創業裡面算是前輩了,先驅。但是因為可能有點太早了,他2013年創建。比如你在Transformer之前創建一個AI公司,你可能會變成先驅,可能後面你就會沒辦法去用最新的技術,最新的信息去做更明智的決定。Regetti整個公司的不論技術層面還是商業層面,其實都現在有點落後,他們CEO現在也退休了。
05 後量子時代的密碼學:銀行與科技巨頭布局新一代加密技術
泓君:今年VC投量子計算,你們有感受到這個市場有在變熱,錢在大批的往裡面湧嗎?
Roger:我覺得現在來說,因為降息也是一個相對近期的時間,并沒有明顯感覺到傳統VC的投資變多。
泓君:那什麼樣的投資變多?
Roger:戰略VC和國家主權VC。比如說John Martinis,就以前谷歌的量子計算的負責人,他的新公司叫Qolab。他這個公司就在去年拿到了1600萬美元,從日本的發展銀行還有一些别的機構拿的錢。
現在處在敏感階段的三個行業,先進半導體、AI量子。我們可以總結說,先進半導體是一個非常傳奇的過去,然後AI是個非常蓬勃的當下,量子計算是不可避免的未來。在一個加息周期裡,政府會對這個不可避免的未來更感興趣。但随着減息周期的開始,我覺得VC對于整個行業會更加關注,特别是Willow的出現,就看下一個加息周期持續到什麼時候了。
泓君:你剛剛提到的這家公司就是日本發展銀行有投到他們,我理解是不是量子計算如果實現了,它對整個全球的密碼系統會要求有一個整體的密碼系統的更新,需要在安全層面上有一些布局?
Roger:這個已經開始了,兩年前拜登的有個行政命令要求所有聯邦機構将自己的加密數改成所謂的抗量子加密。國家标準制定局大概在去年的時候定下了三個标準,進行抗量子加密,所以實際上兩三年前就開始了。
去年2月份的時候,新加坡金管局建議所有新加坡的金融機構采用抗量子加密和QKD(量子密鑰分發),讓應用數據不被洩露出去。這個邏輯其實也是涉及到剛才大家說時間線的問題。為什麼從兩年前金管局,也就就是新加坡央行,都在做這個事情呢?匯豐其實已經在英國做過抗量子加密和安全通訊的試點網絡了。很多銀行也在做,像摩根大通, Chase,他們也算是這個領網域裡面非常大條魚,他們有活躍的抗量子加密和量子通訊的基礎設施和項目發展,都是公開的信息。
泓君:所以抗量子算法的密碼學也是在蓬勃發展。
Roger:其實這些東西很有趣的。之前說政府在主導,這個可以理解。從去年開始是金融界在這方面的進步非常大的,基本上你聽過的銀行都有這方面的獨立項目和共同項目,甚至央行。所以回到剛才的問題,我覺得很多人就是不要看他說什麼,要看他做什麼。如果可以破解加密數的量子計算機還有十到十五年出來。為什麼現在大家這麼急着去改變自己的基礎設施。
泓君:所以你覺得量子計算什麼時候可以破解銀行的密碼呢?因為就是在谷歌Willow芯片發布的那一天,我觀察了一下比特币的價格是大跌的。其實市場上已經很廣泛且很長時間就流行一種說法,量子計算是非常容易去破解比特币的算法的。
因為比特币的算法其實抽成兩部分,一部分是它挖礦的機制的算法,還有一部分就是它的橢圓曲線籤名。在這兩部分的算法裡面,據說橢圓曲線的籤名它是最容易被破解的,甚至它比破解傳統銀行系統的密碼還要更容易。你們理解是這個樣子嗎?
Jared:對,比特币确實是分兩種加密系統。這裡就要提到一種剛才已經聊到的算法,Shor算法。
它是一種專門針對大數分解和離散對數問題的一種量子算法,可以在以多項式時間内破解這個橢圓曲線籤名。這種針對的不僅僅是比特币系統,而是針對所有的公鑰是公開的加密系統,都會相對輕易地被這個Shor算法所攻破。
這與銀行系統不同,銀行系統它是沒有公開的密鑰的,銀行系統的密鑰它本身也是機密信息,不會暴露在外。但是比特币用戶的錢包的公鑰是公開的,在鏈上可查的。任何人都可以通過區塊鏈網絡去訪問這些公鑰。
所以說沒有量子計算機的時代,你拿到公鑰是絕對不可能算出,也不能說絕對不可能,是一個非常大的成本,可能幾萬年才能算得出私鑰。但是有了量子計算機和Shor算法的情況下,在量子計算機有足夠能力的情況下,拿到公鑰之後算出私鑰是一個非常可行的過程。
泓君:多少量子比特才能破解?有人說需要4000個,但是其實我們現在離4000個量子比特還是有很遠的距離的。
Roger:這一點我先更正一下,不管是4000個、3000個比特數量,Shor算法要求的是你的量子比特是沒有錯誤的,就是完全容錯量子計算機。你要有一個4000個量子比特,所謂大規模容錯量子計算機去跑。所以這個就是黃仁勳那個"very useful quantum computer"。
按照他的預測是在大概在十五年之後,你看大家的動作來說顯然不是了,畢竟當這個東西已經開始威脅到自己的錢包的時候,大家的敏感度就變高了。所以我覺得能破解到加密數的這個量子計算機,就是所謂的大規模容錯量子計算機的出現,可能還是要十年之後。而很多機構和公司,特别是銀行,還有比特币,現在已經自己配置了這套加密數了。原因在于,萬一呢?
因為這個不是說一個絕對的,這是一個估計,對吧?就好像GPT Moment,說實話在2022年初的時候,2021年的時候,大家不知道這個進展,當時的普遍認為就是像GPT這種能通過圖靈測試的AI還要8到10年的時間,實際上也就幾個月的時間。
所以說實際上經過這趟之後,很多人意識到技術突破,有點像技術爆炸,你無法預測它什麼時候發現,我只能說我合理推測的10年左右會出來。但是如果五年之後出來,甚至是明年出來,我不會極端的驚訝。沒有物理規律說不可能,這個本質上是工程學問題。
泓君:你剛剛提到了可能實現的完全容錯的量子計算機,它出現的時間可能是快速的,它不是勻速的,我可不可以理解成現在就變成一場競賽了,看誰先出來。如果說有這麼強的量子計算先實現了,那就會對還沒有來得及更新的這些密碼系統造成非常大的威脅。另外一端就是大家在抗量子密碼學的改善上,大家有很多的更新,那它可能是一個非常平緩的過渡。
Roger:首先密碼學的替換,這個相對來說比較簡單。抗量子加密數本身是個加密機制的一個替換,這個很大程度上是個軟體更新問題,或者是一個硬體的替換問題。比如說你要用高速加密的話,你可能需要一個單獨的硬體。但這個包括去年國家标準制定局制定了三個标準抗量子加密算法之後,實際上大家商業化程度角度來講,你就去符合标準去配置就好了。你會看到像匯豐銀行其實去年也發布了他們的crypto,在香港發布的。那個crypto還帶了抗量子加密。
抗量子加密這個東西,本身并不是一個很慢的過程,你得去做。更復雜的反而是像那個通訊,叫QKD,很多銀行也在做QKD,完全不依靠你的加密數本身抗量子加密,而是靠物理層面的格局,這個也是一條路子。
但這個更慢一些,因為它畢竟涉及到光纖網絡這些東西。但是很多銀行其實也自己在推,甚至我們接觸的一個銀行合作夥伴,他們說現在很有趣的情況是銀行再去要求這些通訊公司,像AT&T去部署,叫光纖QKD網絡,來幫助他們在華爾街可以進行安全的通訊。
這個還是挺有趣的。反而是銀行倒逼通訊公司做這個事情,因為通訊公司幹不出來,大銀行也是自己在搞。所以說實際上我不是很擔心因為解密的能力的提升導致所謂的金融體系或者虛拟貨币體系的崩潰,從技術層面上我不覺得。三體有句話說的很好:"傲慢才是最大的問題。"
泓君:還有"我消滅你,與你無關。"
Roger:我覺得現在大家都搭建得很好,包括銀行金融機構,你以為它很傲慢,但他們其實反而是想打安全牌。所以說實際上我覺得包括像加密貨币,他們其實也可以再迭代他們的加密方法,是讓他們的更加安全。這個我覺得是可以做到的,這不是一個"火箭科學"(Rocket science)的問題。
現在處在一個很有趣的階段,就像很多大公司和國家都在想,肯定有地方可以攫取第一筆紅利。與其别人得到,不如我去得到。所以就給我們這邊帶來了比較大的一個契機。我們可以給大公司和一些基礎設施發展項目計算進行配套量子計算設備或者說增加一些設備,就是我們本質上變成了一個伺服器供應商,這一點其實也是我們目前客戶的主要的角度。我們最大的收入來自于向這些數據中心提供我們的量子計算機。
泓君:對于普通人而言,量子計算它會去影響普通人的日常生活嗎?還是說它其實只是會在高精尖的領網域裡面去默默運轉?
Roger:這個東西就有點像計算機早期誕生的時候,它會服務的是什麼呢?就是一個大型跨國機構,或者說甚至是一個國家政府的基礎設施的需求。它提供的是更多的後台的需求,為比如說未來的能服務于普通人的化學產品,或者金融產品,或者AI產品提供助力。
有點像GPU。GPU其實很多年以來都是這些遊戲玩家在玩,有段時間是給挖礦,現在GPU才慢慢進入到所謂的無論玩不玩遊戲,你都得跟我打交道的階段,但是也是從數據中心的角度來服務大眾的。
我覺得量子計算也會經歷這樣的過程,我們會先去服務一些比較特定的高價值客戶,像計算機早期一樣、基礎設施項目、大型機構,然後通過他們去間接服務普通人。但随着根據老黃的"very useful quantum computer"出現在那個年代,其實不光意味着量子計算機可能到了一個完整的形态。甚至我覺得在那個年代這個產業鏈更加成熟,生產效率也更高,所以這個成本也會變得越來越低。
計算機早期很貴的,IBM是最早做計算機產品的公司,造出了Watson計算機,當時的IBM公司主席經典的誤判就是說全世界只需要5台計算機。因為他數了數,需要計算機的就是政府、軍隊、銀行,後來發現明顯誤判了,因為有更多人去用了,發現更多的用途了,就會有更多需求,更多的需求驅動了更多的產量,更多的產量會讓成本下降。