今天小編分享的科學經驗:希爾伯特旅館裡,住着AI的某種真相,歡迎閱讀。
" 無窮 " 和 " 無窮 +1",哪個更大?
已經吸收了不知道多少數據的 AI 模型,和比他多學習一條數據的模型,哪個更智能?
想聊聊這個問題,出于一個偶然的機會。很早之前我在測試 ChatGPT 的時候,突然想問他個刁鑽問題,于是就問它:" 希爾伯特旅館悖論,對現實世界有什麼影響?"
說實話,ChatGPT 答的驢唇不對馬嘴,還硬拗出幾點,有他一貫的特色。但其中一段回答值得琢磨。他答:" 希爾伯特旅館對于計算機科學是有幫助的,因為當我們處理無限大的數據集時,希爾伯特旅館可以作為我們思考方式。"
無限大的數據集,這東西顯然不存在。但當大模型訓練用的數據參數達到某種天文數字,當真人反饋機制成為常态,模型在使用過程中會接觸難以估量的數據。這難道不是某種無限嗎?
但人類能控制無限嗎?
今天這個話題,其實更接近某種科幻讨論,或者一些關于 AI 未來的腦洞。可能大家讀完之後也不清楚在說什麼。但也無妨,我們就當一起舒展一下大腦,放松一下最近被 ChatGPT 弄得挺焦躁的心情。
一起去希爾伯特旅館,度個假吧。
歡迎來到,悖論旅館
這家旅館坐落在名叫 " 數學 " 的熱帶風情度假勝地,有的人來了不想走,有的人一想到它就口幹舌燥。
希爾伯特旅館,其實是德國數學家大衛 · 希爾伯特在讨論無窮這個概念時,舉的一個生動例子。它既是一個數學遊戲,也經常跻身知名的若幹悖論之一。
它的具體意思是說,假設一家旅館有無窮個房間,但是都住滿了。這時候又來了一位旅客要訂房間,酒店主人就可以不慌不忙,讓 1 号房間客人移到 2 号,2 好移 3 号……以此類推,反正房間數量是無窮的,這樣新的旅客就可以住 1 号房間。
而這時,又來了一車旅客。酒店主人依舊如法炮制,讓每個房間的客人都向後移動 N 個房間,最終把新來的客人安置進去。
以此類推,接下來會發生什麼呢?假如新來了無窮個客人。那麼酒店老板只需要讓每位客人都移到單号房間。比如 2 号房間移到 3 号房間,3 号房間移到 5 号房間,把偶數房間都空出來,那麼無窮個客人依舊可以住進去。
即使來了無窮多個旅行團,每個旅行團有無窮多位旅客,希爾伯特酒店依舊有辦法,只需要把非 2n ( n ∈ N+ ) 号房間就都空出來就行了。
希爾伯特旅館之所以是個悖論,因為它标明了這樣一件事:無窮是無法比較的。
無窮 +1 等于無窮;無窮 +N 等于無窮,無窮加無窮,無窮乘無窮,那還是無窮,無窮是紋絲不動的,又是随時變化的,無窮是可以包含若幹個無窮的。
總之,無窮是難以名狀的。
無窮這玩意,會有點怪
聽上去,希爾伯特旅館悖論好像沒啥用。其實不然,人類在很多領網域幾乎都必然面對 " 無窮 " 這個問題,至少在理論推導和概念驗證環節,面對無窮幾乎是必然的。一個事物可以比另一個更無窮,但它們倆都還是無窮。這樣的思路可以進行很多假設,也可以解釋很多問題。
比如說,在物理學當中,希爾伯特旅館悖論可以來解釋量子物理學中的很多現象,其中最典型的就是量子場論中關于虛粒子的假設。關于虛粒子是否真實存在,抑或是一種純粹的假設工具,這個問題有着非常多的争論,但它确實可以用來解釋引力、光子、膠子等物理定義,進而為解釋真空中的能量情況,分析宇宙輻射做出幫助。前提在于,我們需要用希爾伯特旅館的思維,來理解存在于無窮中的虛粒子。
在計算機科學中,數據存儲是個基本問題,而在設計數據結構的時候,就需要考慮如果有海量數據需要存儲,結構上究竟如何調動能夠保證效率最優,故障率最低。這時就需要假定數據集是無窮的,希爾伯特旅館也就用上了。
無窮很怪,這個概念還經常被用在文學創作,尤其是科幻小說當中。科幻是對未來的推演,但如果某件事可以增長到無窮,它往往會出現反常識的狀态。比如說永生不死的人,它可能首先就會失去對時間的概念,因為無窮的時間已經沒有意義了,進而表現出完全失去人類的一切特征,畢竟人類的所思所為,都是在時間有限這個前提下驅動的。又比如瞬間移動,它會不會讓空間失去意義,進而讓人失去辨别空間的需求和能力,進而出現從來不想停留下來的人,而始終都在超高速移動的人,究竟還是人嗎?
一件事如果逼近甚至抵達無窮,它就會超出控制,出現反常識,反邏輯的一面。這個邏輯,對于 AI 似乎也适用。
用這個邏輯,解釋智能湧現
這幾年伴随着預訓練大模型的興起,越來越多的人開始談 " 智能湧現 "。一般來說,所謂 " 智能湧現 " 現象,是指當模型規模突破某個未知的界限後,就會突然湧現出驚人的智能。比如模型會表達出訓練者預想不到的邏輯感、流暢性,甚至是人類稱之為情商的東西。
事實上,智能湧現作為一個目标,并不是今天才有。早在上世紀 70 年代,專家機器人的理論構想就是在輸入足夠多的知識後,讓計算機展現出一種無所不知,無所不曉的效果,從而幫助人類解決各種問題。只是礙于當時的算力與數據承載能力,最終這個設想無法落地。
而在今天雲計算 + 大數據的組合下,更大規模的數據集可以應用到 AI 訓練中,加上深度學習在算法上實現了更好的數據吸納能力,才最終產出了 ChatGPT 為代表的智能湧現現象。
智能湧現到底是怎麼實現的,這一點就像深度學習的黑箱性一樣,始終沒有特别合理的解釋。但 " 智能湧現 " 這個詞卻不是 AI 專有的,這個詞更早是一個生物學詞匯,是用來描述螞蟻、魚群表現出的集體智能行為。一只螞蟻挺傻的,一條魚也不聰明,但當大量螞蟻聚集到一起,所表現出的那種分工明确、體系森嚴、結構精巧的組織行動方式,簡直讓人嘆為觀止。是螞蟻的大腦進化了嗎?恐怕并不是,而是在螞蟻聚集到一定規模後,突破了某種希爾伯特旅館式的智能邊界。
從這個角度看,大模型這條 AI 之路,或許終極目标并不是模仿人類。它不需要進化出直覺、情感、自由意識這些人類獨有的東西。但它會積累無窮多的數據和知識,當我們無法觀測和預估大模型裡擁有多少知識,那麼它就有無窮的知識。AI 模型就變成了一座類希爾伯特旅館,它可以吞噬更多知識,吞噬更多無窮,最終可以表現出人類想要的智能,也可能表現出更多人類不想要,或者沒準備好想要的東西。
或許我們改換個思路,最終的通用人工智能 AGI、強人工智能 Strong AI,可能内在機制并不類似于人類,而是更近乎螞蟻,近乎魚群,近乎希爾伯特旅館。
我們總是讨論 AI 像不像人,能不能做人類所做的,人類有哪些獨有能力,巴拉巴拉巴拉。這是因為我們不住在希爾伯特旅館裡,我們住在一個有限的世界,住在短暫的生命和易朽的軀殼裡,住在一個絕大部分構成物是水的大腦裡。但 AI 不是,它相比人類更加貼近無窮。他能通過圖靈測試,他最終能做到一切。但我們并不知道為什麼,因為 AI 并不想成為人,他只是剛好住在希爾伯特旅館裡。
" 智能湧現 " 或許是個征兆,它告訴我們,AI 的進化目标不是人類,而是《星際争霸》裡的蟲族。
>