今天小編分享的科技經驗:腦機接口和 AI,一個硬币的兩面,歡迎閲讀。
整理 | 湯一濤編輯 | 靖宇
腦機接口一度承載了人們對賽博格的絕大部分想象,但是這兩年腦機接口的進步似乎并不是預想中的快,尤其是在 AI 日新月異的進步襯托下。
這其中當然有很多復雜的原因。腦機接口本身就是一個典型的交叉學科,涉及到了電極材料、芯片封裝、醫療器械、算法,是一個非常復雜的全系統。更為關鍵的是,倫理問題使得腦機接口的每一次試驗都必須十分慎重。彭雷提到,他們往往需要一年時間來準備一場試驗。
實際上,AI 的很多關鍵技術突破,往往都有腦科學理論的身影,例如神經網絡,例如影像識别。
2021 年,上海腦虎科技有限公司成立(下稱「腦虎科技」)。對比另一家腦機接口的明星公司——馬斯克的 Neuralink,在成立的 3 年中,腦虎科技已經把兩者的差距從 7、8 縮小到了 3 年内。
在彭雷看來,腦機接口和 AI 分别象征着橋的兩端,一端代表碳基生命擁抱硅基生命,一端代表硅基生命模拟碳基生命。他相信,soon or later,這兩個技術都會在橋的中間合攏。
以下是腦虎科技 CEO 彭雷在 IF 2025 的演講全文,經極客公園整理。在演講中,彭雷分享了腦機接口和 AI 的關聯,以及腦機接口的未來。
彭雷在極客公園 IF2025 創新大會上講解腦機接口技術的最新進展|圖片來源:極客公園
01 神經科學啓發了很多 AI 的關鍵突破
大家下午好,我是腦虎科技的 CEO 彭雷,今天我分享的話題是「一個硬币的兩面—— AI 和 BCI」。BCI 就是腦機接口的簡稱,叫 brain-computer interface。
聽上去大家可能覺得 BCI 跟 AI 沒有什麼聯系,但我相信聽完我的分享之後,大家會發現其實這兩件事情在底層邏輯層面上有很高的一致性。它們有一個互洽的過去,也有着一個共同的未來。
我們回顧一下 AI 過去 20 年,尤其是最近 3、5 年的重大事情,你會發現神經科學在 AI 幾次關鍵技術突破上都扮演了非常重要的角色。例如,我們最早對神經網絡的設計來自于我們對大腦神經元的放電的原理的研究,然後產生了神經網絡;影像識别是來自于視覺神經元怎麼處理視覺信号的一些研究;包括 Transformer 架構以及現在的大語言模型,背後本質上是一個叫 attention 的機制,這也來自于神經科學裏對人的注意力的研究。
今年獲得諾貝爾獎的 Jeff Hinton 就曾經也説過,人工智能的整個研究都是借鑑神經科學的基礎。但上個月在跟多倫多大學的采訪中,Hinton 也説,他作為一個做了 20 年 AI 研究的科學家,覺得現在對神經科學的研究太慢了。
也就是説,剛開始神經科學給 AI 起了個頭,但是後面 AI 的發展速度更快,顯得神經科學的發展速度慢了。這個背後有很多原因,我稍後會展開。
首先問一個問題,大家有沒有想過大腦跟 GPU 的關系是什麼?大家可能覺得好像沒有什麼可比性,但實際上從物理上來講、從數學上來講,他們是有很多方面可以參照對比的。
就拿現在大家已經買不到的英偉達的 H200 來舉例子。它的晶體管有 10 的 11 次方;大腦差不多是 860 億個神經元,大概也是 10 的 11 次方。所以GPU 從濃度上來説已經可以做到和大腦比較一致了。
但是從結構組件上來講,GPU 晶體管之間的連接,還是跟大腦有重大的區别。大腦神經元跟神經元之間的連接可以有 10 的 4 次方次,而晶體管跟晶體管之間的連接可能是個位數。所以從這個角度來講,雖然説晶體管跟神經元數量相當,但是它們在連接通路上有 10 的 4 次方的差異。
這是第一個差異點。
第二個差異點,大腦是存算一體的,沒有計算單元和儲存單元分離這麼一説;而我們現在的計算機在馮 · 諾依曼架構下,還是存算分離的。
第三個差異點是軟硬分離和軟硬一體的差别。我們不管開發什麼軟體,可以跑在這台電腦上,也能跑在那台電腦上,軟體跟硬體是可分離的。但是大腦的軟體跟硬體是不可分離的。
所以之前有人問我,AI 是不是可以很快地模拟整個大腦?
我自己認為大概還有 10 的 9 次方的差異。其中自于 10 的 4 次方,是由于神經元之間的連接通路比晶體管的連接通路復雜很多。
還有 10 的 4 次方到 5 次方的差異是來自一個重要的特性,叫神經可塑性,就是説這個神經元跟神經元之間的連接是可以動态變化的。像今天我在跟各位分享,本質上就是我的 800 億個神經元在噼裏啪啦地放電,傳遞我想説的話。在座的各位的神經元也在噼裏啪啦地放電,我的聲音。而聽完這段聲音之後,你們今天回去,你的大腦會永久地被我所改變——因為我創造了你的新的連接,產生了新的 pattern,你有了新的認知、新的記憶。那這個過程就意味着神經元之間的連接是可以被改變的,而晶體管之間的連接是不能改變的。這裏面至少又差了 10 的 4 到 10 的 5 次方的復雜度。
所以説我説這兩個路徑是在相向而行的,但是兩邊的速度不一樣。
02 腦機接口行業在做什麼?
接下來我展開説説 BCI,跟大家講一下 BCI 到底在做什麼。
首先跟大家做一個簡單的科普,腦科學中對大腦的認知。我們知道它是我們最重要、最脆弱的器官,也是我們有别于動物最重要的區别。但在腦科學的定義中,我們所有的感知、認知、記憶、情感、情緒全是由電信号決定的。只要我能讀你的電信号,我就有機會能改你的電信号。
所以説我們面對的自身,本質上其實是一堆電信号產生的各種感知跟認知。
那我們現在對大腦的了解是什麼水平呢?
我覺得人類目前對大腦的了解可能不到 10%。大腦有不同的區網域,今天我們已經知道哪些地方管理運動,哪些地方管理語言,哪些地方管理聽覺。但是更高級的功能,像知識、記憶、情感、意識、自我認知,這些在哪其實我們都不知道。
也就是説,我們大概知道基礎的運動是怎麼控制的,但其他的東西都還處于探索階段,它是由非常復雜的網絡來支配的。
而腦機接口的本質就是在大腦的不同區網域裏面插入電極。電極就像導線一樣,對那個區網域神經元放電的信号進行讀取,同時也可以對那個神經元進行刺激。
腦機接口的特征是個典型的交叉學科,涉及到了電極材料、芯片封裝、醫療器械、算法,是一個非常復雜的全系統,難度是非常之高的。而我們做很多研究的目的,都要解決如何讓大腦在植入腦機接口的時候受益更多、受創傷更少。這是一個不斷要 trade off 的事情。
這是腦機接口的植入位置,是一個縱剖面。植入的過程就是切開頭皮、顱骨、硬腦膜到腦組織,讓電極插在不同的位置,能記到不同的信号。簡單地講,離腦子越近,記到的信号越好。
現在行業裏面主要有三個技術路線。一種是左邊的這種硬質電極,就這麼一個鐵盤。這其實是個硅片,有指甲蓋那麼大,上面有 100 根針。它直接打開大腦插到你的大腦皮層裏面去。這 100 根針,就意味着 100 個通道,可以記錄 100 到 200 個神經元放電的信号。
第二個是血管支架,通過靜脈血管放在大腦裏面,血管裏面隔着血管去記錄神經元。
第三個就是馬斯克的 Neuralink,包括我們腦虎科技使用的柔性電極系統。
誕生 20 年以來,第一種技術路線全球植入了 60 個人,第二個路線植入了 10 人,第三個路線是 3 人。
這是第一個技術路線插到人腦上的效果。可以看到患者頭上有一個非常大的設備,我們叫 head stage。這個設備是将電信号轉移出來,然後基于這個信号來控制機械臂進行一些簡單的操作。這個患者是高位截癱,意味着他脖子以下都是不能動的。但植入腦機接口後,他可以控制兩個機械臂切蛋糕吃。我們看上去是平平無奇的動作,但對于一個高位截癱的患者來講,切開蛋糕,用叉子叉起來,很緩慢地拿到自己嘴裏,是很困難的一件事情。但是通過腦機接口,配合機械臂,這一步已經可以實現了,可以非常大地提升患者的生活質量。
但你也可以看到,這套效果永遠還能在實驗室實現。他頭上接了 3 根線,還有龍門架和其他一堆設備,你沒有辦法在醫院或者家裏用。
第二種路線,血管支架,就是把電極放到血管裏。它的天花板比較低,我就跳過了。
第三種技術路線,柔性電極系統,代表公司就是馬斯克的 Neuralink。馬斯克真正當 CEO 的只有 3 家公司,一個特斯拉,一個 SpaceX,最後一個就是 Neuralink。
這是 Neuralink 今年最新的臨床進展,可以看到它将前面頭上那 3 個很大的設備變成了一個極小的單設備的腦機接口,植入皮下之後完全實現了無線。這是我覺得工程師跟科學家的區别,科學家可以跑 20 年,證明原理可行,但幹得非常復雜。馬斯克就用它的第一性原理把設備幹得極小、極方便,工程能力拉滿。
今年 1 月份 Neuralink 植入了第一個患者。這個患者也是高位截癱,它通過腦機接口能夠完整地控制電腦。他正在玩的遊戲叫 Webgrid,原理就是移動滑鼠點擊。
這個遊戲在在 Neuralink 官網上就有。我玩這個遊戲大概是 11 分,已經是非常快的速度,我們公司平均下來得分在 9 分左右。但是這個患者純粹用腦控制想象,就可以做到 9.5 分,已經比很多健全的人都快了。
我們講腦機接口發展需要 3 個核心的要素,高通量、低創傷和長期在體。
高通量很好理解,我們有 800 億個神經元,那我們希望能記錄下來的神經元數量是多少?馬斯克能記錄 1024 個,我們能記錄 256 個,還有幾倍的差距。但我也抛出過一個概念是腦機接口的摩爾定律,就是我們認為能讀寫神經元的數量,每 18 個月應該會翻一番,至少我們是這樣做的,馬斯克也是這樣做的。
所以説未來 8 年、 10 年,我覺得能記錄上百萬通道神經元的腦機接口一定會出現。這樣你控制手、控制機械臂,甚至控制特斯拉車、控制 Optimus 機器人,從原理上來講都是可行的。
03 為什麼神經科技發展速度比 AI 慢?
AI 和腦科學真的是一個橋的兩邊,在相向而行。我們整個產品包括了硬體、軟體和動物資源,AI 領網域裏面也有同樣的硬體,軟體跟實驗資源,完全可以對應。我們做的腦機接口的這套東西,放在 AI 領網域就是英偉達做的事情——從整個基礎的芯片、到硬體框架、網絡連接、交換等等。然後數據跟算法其實就是 CUDA,就是 hugging face。但是現在在 AI 裏面有非常成熟的數據集跟算法的分享集,腦科學裏面還沒有形成,所以我們要建立自己對腦信号腦算法解碼的 Hugging Face 跟 CUDA。
但是為什麼神經科學的發展速度比 AI 的慢?原因只有一個,就是倫理。我們沒有辦法大規模地去做動物的實驗和人的試驗。每做一次試驗,我們都要準備一年,要非常嚴格地評估患者的受益,一步步按照相關的要求走。但是 Sam Altman 去融 15 億美元,把 GPU 的規模放大 20 倍,就可以迭代了。
所以説我們也希望在腦科學領網域成為英偉達這樣的基礎公司,加上像 Hugging Face、CUDA 這樣的生态,來讓全球的神經科學家共同加速,這樣我們硅基跟碳基的融合可能會比想象的更快來到。
我們腦虎在去年做到了兩個實驗,一個是訓練狗在跑步機上走路,來解碼它怎麼控制四只腿的;另一個是訓練猴通過解碼來打乒乓球的遊戲。這兩個是馬斯克在 21 年做到的事情,我們在 23 年做到了。所以説從實驗進度的角度來講,我們大概落後它兩年半到三年的時間。但我們作為一家新創的中國公司,跟它的這個差距是從最初的七八年慢慢的縮小 3 年,我們覺得還是進步很快的。
04 腦機接口的未來
那馬斯克現在在做什麼呢?
第一個是運動恢復。現在的患者都是用腦控設備,但是未來可以做到腦控外骨骼、腦控機械臂,那患者就可以用他自己的軀體站起來,或者控制機器人來幫他做一些事情。
第二個是語言接口。我現在已經在非常快地表達了,但其實也就每分鍾 140 個字。實際上大腦的想象速度肯定超過 140,只是人講不了那麼快,你也聽不了那麼快。有朝一日通過腦機接口,可以将我的表達用 1 分鍾 800 個字傳遞給你,就不用這麼來回講了。去年實驗室裏已經能夠做到正常人説話速度的 60%,未來這個速度一定還會提高。
第三個是視覺。對于盲人或者沒有眼球的人,可以通過在視覺皮層刺激,讓他看到黑暗中有閃爍的白色的斑點。這些白色的斑點就可以用來描繪物體的邊界。那對于一個盲人來講,60 個通道能看到這樣的東西。到 600 個通道、 2000 個通道,其實可以説繞過眼球傳遞視覺是完全可行的。馬斯克已經開始招募做視覺刺激的患者了,我相信在明年年底這個產品方案應該就會看到第一個植入的人。
第四是記憶假體。大家可能發現自己随着年紀大了,記憶越來越差。本質上對記憶儲存的位置還在研究中,但是有一些機會能夠對記憶進行強化,或者選擇性遺忘,甚至修改。當然現在修改還遠遠談不上,但是加強跟選擇性遺忘是有科學根據支撐的了,也有些公司在做這樣的事情。
然後還有具身智能。Optimus 前兩天剛發了視頻,可以看到它下個坡已經很流暢了,也能适用于各種環境。相信未來植入腦機接口的人也不一定完全要靠自己的身體,可以直接通過腦控 Optimus 幫他完成事情。那這可能就真是一個機械飛升的過程。
我們相信硅基生命和碳基生命的融合會在 2035 到 2045 年之間發生。我們代表了碳基生命這邊擁抱硅基生命的趨勢,其他 AI 夥伴們代表了硅基生命在模拟我們的方式。反正 soon or later,我們會在中間合攏。
我相信大家在有生之年一定可以看到這件事,我們也希望能夠共同推動把這件事做成。