希爾伯特旅館裏，住着AI的某種真相

今天小編分享的科學經驗：希爾伯特旅館裏，住着AI的某種真相，歡迎閲讀。

" 無窮 " 和 " 無窮 +1"，哪個更大？

已經吸收了不知道多少數據的 AI 模型，和比他多學習一條數據的模型，哪個更智能？

想聊聊這個問題，出于一個偶然的機會。很早之前我在測試 ChatGPT 的時候，突然想問他個刁鑽問題，于是就問它：" 希爾伯特旅館悖論，對現實世界有什麼影響？"

説實話，ChatGPT 答的驢唇不對馬嘴，還硬拗出幾點，有他一貫的特色。但其中一段回答值得琢磨。他答：" 希爾伯特旅館對于計算機科學是有幫助的，因為當我們處理無限大的數據集時，希爾伯特旅館可以作為我們思考方式。"

無限大的數據集，這東西顯然不存在。但當大模型訓練用的數據參數達到某種天文數字，當真人反饋機制成為常态，模型在使用過程中會接觸難以估量的數據。這難道不是某種無限嗎？

但人類能控制無限嗎？

今天這個話題，其實更接近某種科幻讨論，或者一些關于 AI 未來的腦洞。可能大家讀完之後也不清楚在説什麼。但也無妨，我們就當一起舒展一下大腦，放松一下最近被 ChatGPT 弄得挺焦躁的心情。

一起去希爾伯特旅館，度個假吧。

歡迎來到，悖論旅館

這家旅館坐落在名叫 " 數學 " 的熱帶風情度假勝地，有的人來了不想走，有的人一想到它就口幹舌燥。

希爾伯特旅館，其實是德國數學家大衞 · 希爾伯特在讨論無窮這個概念時，舉的一個生動例子。它既是一個數學遊戲，也經常跻身知名的若幹悖論之一。

它的具體意思是説，假設一家旅館有無窮個房間，但是都住滿了。這時候又來了一位旅客要訂房間，酒店主人就可以不慌不忙，讓 1 号房間客人移到 2 号，2 好移 3 号……以此類推，反正房間數量是無窮的，這樣新的旅客就可以住 1 号房間。

而這時，又來了一車旅客。酒店主人依舊如法炮制，讓每個房間的客人都向後移動 N 個房間，最終把新來的客人安置進去。

以此類推，接下來會發生什麼呢？假如新來了無窮個客人。那麼酒店老板只需要讓每位客人都移到單号房間。比如 2 号房間移到 3 号房間，3 号房間移到 5 号房間，把偶數房間都空出來，那麼無窮個客人依舊可以住進去。

即使來了無窮多個旅行團，每個旅行團有無窮多位旅客，希爾伯特酒店依舊有辦法，只需要把非 2n ( n ∈ N+ ) 号房間就都空出來就行了。

希爾伯特旅館之所以是個悖論，因為它标明了這樣一件事：無窮是無法比較的。

無窮 +1 等于無窮；無窮 +N 等于無窮，無窮加無窮，無窮乘無窮，那還是無窮，無窮是紋絲不動的，又是随時變化的，無窮是可以包含若幹個無窮的。

總之，無窮是難以名狀的。

無窮這玩意，會有點怪

聽上去，希爾伯特旅館悖論好像沒啥用。其實不然，人類在很多領網域幾乎都必然面對 " 無窮 " 這個問題，至少在理論推導和概念驗證環節，面對無窮幾乎是必然的。一個事物可以比另一個更無窮，但它們倆都還是無窮。這樣的思路可以進行很多假設，也可以解釋很多問題。

比如説，在物理學當中，希爾伯特旅館悖論可以來解釋量子物理學中的很多現象，其中最典型的就是量子場論中關于虛粒子的假設。關于虛粒子是否真實存在，抑或是一種純粹的假設工具，這個問題有着非常多的争論，但它确實可以用來解釋引力、光子、膠子等物理定義，進而為解釋真空中的能量情況，分析宇宙輻射做出幫助。前提在于，我們需要用希爾伯特旅館的思維，來理解存在于無窮中的虛粒子。

在計算機科學中，數據存儲是個基本問題，而在設計數據結構的時候，就需要考慮如果有海量數據需要存儲，結構上究竟如何調動能夠保證效率最優，故障率最低。這時就需要假定數據集是無窮的，希爾伯特旅館也就用上了。

無窮很怪，這個概念還經常被用在文學創作，尤其是科幻小説當中。科幻是對未來的推演，但如果某件事可以增長到無窮，它往往會出現反常識的狀态。比如説永生不死的人，它可能首先就會失去對時間的概念，因為無窮的時間已經沒有意義了，進而表現出完全失去人類的一切特征，畢竟人類的所思所為，都是在時間有限這個前提下驅動的。又比如瞬間移動，它會不會讓空間失去意義，進而讓人失去辨别空間的需求和能力，進而出現從來不想停留下來的人，而始終都在超高速移動的人，究竟還是人嗎？

一件事如果逼近甚至抵達無窮，它就會超出控制，出現反常識，反邏輯的一面。這個邏輯，對于 AI 似乎也适用。

用這個邏輯，解釋智能湧現

這幾年伴随着預訓練大模型的興起，越來越多的人開始談 " 智能湧現 "。一般來説，所謂 " 智能湧現 " 現象，是指當模型規模突破某個未知的界限後，就會突然湧現出驚人的智能。比如模型會表達出訓練者預想不到的邏輯感、流暢性，甚至是人類稱之為情商的東西。

事實上，智能湧現作為一個目标，并不是今天才有。早在上世紀 70 年代，專家機器人的理論構想就是在輸入足夠多的知識後，讓計算機展現出一種無所不知，無所不曉的效果，從而幫助人類解決各種問題。只是礙于當時的算力與數據承載能力，最終這個設想無法落地。

而在今天雲計算 + 大數據的組合下，更大規模的數據集可以應用到 AI 訓練中，加上深度學習在算法上實現了更好的數據吸納能力，才最終產出了 ChatGPT 為代表的智能湧現現象。

智能湧現到底是怎麼實現的，這一點就像深度學習的黑箱性一樣，始終沒有特别合理的解釋。但 " 智能湧現 " 這個詞卻不是 AI 專有的，這個詞更早是一個生物學詞匯，是用來描述螞蟻、魚群表現出的集體智能行為。一只螞蟻挺傻的，一條魚也不聰明，但當大量螞蟻聚集到一起，所表現出的那種分工明确、體系森嚴、結構精巧的組織行動方式，簡直讓人嘆為觀止。是螞蟻的大腦進化了嗎？恐怕并不是，而是在螞蟻聚集到一定規模後，突破了某種希爾伯特旅館式的智能邊界。

從這個角度看，大模型這條 AI 之路，或許終極目标并不是模仿人類。它不需要進化出直覺、情感、自由意識這些人類獨有的東西。但它會積累無窮多的數據和知識，當我們無法觀測和預估大模型裏擁有多少知識，那麼它就有無窮的知識。AI 模型就變成了一座類希爾伯特旅館，它可以吞噬更多知識，吞噬更多無窮，最終可以表現出人類想要的智能，也可能表現出更多人類不想要，或者沒準備好想要的東西。

或許我們改換個思路，最終的通用人工智能 AGI、強人工智能 Strong AI，可能内在機制并不類似于人類，而是更近乎螞蟻，近乎魚群，近乎希爾伯特旅館。

我們總是讨論 AI 像不像人，能不能做人類所做的，人類有哪些獨有能力，巴拉巴拉巴拉。這是因為我們不住在希爾伯特旅館裏，我們住在一個有限的世界，住在短暫的生命和易朽的軀殼裏，住在一個絕大部分構成物是水的大腦裏。但 AI 不是，它相比人類更加貼近無窮。他能通過圖靈測試，他最終能做到一切。但我們并不知道為什麼，因為 AI 并不想成為人，他只是剛好住在希爾伯特旅館裏。

" 智能湧現 " 或許是個征兆，它告訴我們，AI 的進化目标不是人類，而是《星際争霸》裏的蟲族。