今天小編分享的教育經驗:北師大教授張江:為什麼規模法則是解讀世界的重要工具?,歡迎閱讀。
復雜科學是一個跨學科的領網域,它融合了物理學、生物學、計算機科學、經濟學和社會學等多個學科的理論和方法,旨在理解復雜系統的行為和動态。而 " 規模法則(Scaling Laws)" 是復雜科學中一個重要的概念,旨在描述不同系統和現象如何随着規模變化而變化的規律。這些法則在自然界、工程學、生物學、城市發展、經濟等多個領網域都有廣泛的應用。
2024 年 11 月 15 日,北京師範大學系統科學學院教授張江老師在西塘為我們帶來了一堂關于規模法則的課程,以下是本次課程節選。
規模縮放法則
今天我們會看到有大量的數學定量公式可以去描述這個復雜世界背後所蘊含的統一規律,這些規律就是所謂的規模法則。正是有這些規律的存在,復雜科學才得以成立。
規模理論的提出者 Geoffrey West,早年是一個純粹的理論物理學家,由于家族的前輩們在 50 歲時出現了普遍的衰老乃至死亡,在其 50 多歲的時候,他也開始擔心自己的身體健康問題,并将其當作一個科學問題來探索。
一個生命體的壽命長短是由什麼因素決定的呢?他開始查閱大量的生物學文獻,但是這些文獻都沒有辦法直面回答他的問題。一次偶然的機會,他遇到了生态學家 James Brown,James 告訴他,從生态學的角度來說,這一問題的答案可能與 " 規模 " 相關。此後,二人開展了長達十年的合作,最終确立了規模法則,并将這套理論應用于公司企業、城市規劃之中。
什麼是規模法則呢?其英文為 Scaling,又譯為規模縮放法則。人類的大腦最習慣于進行線性思考,自然而然地認為一個十人規模的企業擴大到百人規模時,就能從賺一個億到賺十個億,而規模法則最為重要的特點就在于強調變化的非線性。一個生命體從小變大,雖然各個部位都會相應放大,但是放大的比例卻不盡相同。兩個四點五寸的披薩和一個九寸的披薩面積并不等同,是因為當披薩的尺寸增加時,其面積的增長速度是平方級别的。
科幻片中身高兩三層樓高的巨型怪獸哥斯拉在真實的物理世界中是不可能存在的,因為它的雙腿無法支撐起它的整個體重。如果把一個生命體抽象成一個立方體,體積的增長呈三次方規律,而截面積的增長則呈二次方規律。截面積越大,承受力就越強。随着生物體的增長,其體重的增長速率将遠超承受力的增長速率。
規模法則也同樣适用于大語言模型的發展。2020 年,研究就發現,随着模型參數的擴大,一系列的性能指标都會出現不同比例的變化,代入公式就可以進行外推,人工智能系統在未來能夠達到什麼樣的水平。這也是 Open AI 笃定大模型的方向,并應用于科技創新的原因。
生命體中的規模法則
上百年來,科學家們對于復雜系統的研究形成了一定的科學範式。第谷進行了長達 20 年的天文觀測,親手在筆記本上把觀測的數據記錄下來,形成了非常珍貴的手稿。在臨終前,第谷把記錄了 20 年的數據手稿交給了開普勒,将行星運行背後的原理性問題留給了他解決。開普勒在進行了幾年的研究之後,跳脫出行星沿圓形軌道運動的看法,結合數據總結出了行星沿橢圓軌道運行的規律,提出了著名的開普勒三大定律。牛頓應用他的第二運動定律和萬有引力定律,在數學上嚴格地證明了開普勒定律。
事實上,這三個人就代表了自然科學發現的三個階段。第谷代表的是第一階段,即數據收集階段。開普勒代表的是第二階段,即唯象階段,用一套數學原理去解釋觀測到的數據。比如開普勒三大定律就完美解釋了第谷觀測了 20 年得到的數據,揭示了太陽系中行星的運行規律,但局限在于其無法推廣到别的星系。牛頓代表的是第三階段,即原理階段,代表着事物發展的底層規律,可以應用在更廣的範圍中。
規模法則處于第二階段,反映生物系統中的規律的 " 克萊伯法則 "F=cM^3/4 被我稱為 " 生物界的開普勒定律 "。從單細胞内部的線粒體到鲸魚大象,克萊伯定律适用範圍橫跨了 20 個數量級。這條規律表明,生物體的代謝水平與體積大小之間具有正相關性。當一個生物體的體重增長了十倍,其代謝水平則以一個相對較慢的速度增長,大概在八至九倍。體重越大的物種,每個細胞的代謝水平就越低,能力利用率就越高。
由于代謝是生物體不斷進行物質和能量交換的過程,因此和生物體的表面積關聯較密。從幾何的角度看,表面積和體積的 2/3 次幂成正比,然而,代謝率與體重之間并非 2/3 次幂的關系,而是 3/4 次幂的關系。到底是哪裡出錯了呢?研究發現,我們的世界不僅僅停留在三維的層面,生物體的褶皺分形構成了一個四維的空間。我們的大腸表面大量的毛細血管網絡,植物、動物和單細胞裡面的細胞骨架,都構成了所謂的分形幾何體,正是這些分形幾何體導致了四分之三幂律。
克萊伯定律就告訴我們一個道理,不要盲目進行線性外推,而這是一個連頂尖科學家都會犯的錯誤。在上個世紀六十年代,科學家對一種名為 LSD 的毒品展開了大量的實驗研究,并測算出貓的安全劑量為 0.1 毫克每公斤,他們依次推測一個體重為 3000 公斤的大象的安全劑量為 300 毫克,并少注射了 3 毫克進入大象體内。結果,實施注射 5 分鍾之後,大象開始大叫起來,轟然倒地,并進入持續癫痫狀态,在 1 小時 40 分鍾之後便死亡了。
同樣地,我們平時吃藥也要謹遵醫囑,不能線性地外推。2 歲的小孩大概 12.5 公斤,服藥的劑量為一包。7-8 歲的小孩體重是 2 歲小孩的兩倍,但是服藥的劑量卻小于兩包。而醫生給病患開藥的時候,已經考慮到了年齡、體重等因素。
人類懷胎十月生出寶寶,而小貓懷孕可能兩三個月就能生下一胎。生命體的特征時間 T 與體重之間也有規律,為 1/4 次幂的關系。另外,生物體的特征頻率 f,即心跳頻率與體重也有關系,為 -1/4 次幂的關系。把這兩條規律結合在一起,還有一個令人震驚的發現:當生命體的特征時間與特征頻率相乘時,會得到 1.5*10^9 這個結果。這就意味着,生命體一生的心跳次數是一個恒定的常數結果。體重大的生命體壽命較長,但是頻率就相應地變低了;體重小的生命體壽命較短,但卻有較高的頻次,冥冥之中自有定數。
從克萊伯定律和能量守恒等基本原理出發,可以推導出生物體從出生到死亡體重變化的過程,即生長曲線。這一過程可以抽象為一個水缸模型:生物體的體重就相當于水缸中的水量,體重的變化則可以視為水的注入和流出帶來的結果。代謝水平對應的是水的流入量,維持生命活動所需要的能量代表的是水的流出量。
生物的代謝與體重的 3/4 次幂成正比,因此呈彎曲形态。随着體重的增加,代謝流量增長逐漸減緩。生物的維護成本與體重成正比,因此呈直線狀态。随着體重的增加,維護流量始終以固定速率增長。生物的生長就發生在流入量高于流出量的時候。
這一生長曲線的普适性進一步被驗證:不同物種的生長數據,都能在同一曲線上找到對應位置。規模法則在生物界的作用就類似于開普勒定律在天文學中的作用,能夠有效描述生物體生老病死的實證數據。
企業中的規模法則
企業是經濟系統的基本單元,規模法則是如何在企業中體現的呢?
規模法則可以用來分析企業銷售額與員工數之間的關系。根據 2008 年美國 300 多家上市企業的數據形成了一張散點圖,一個小點就代表一家企業,其中橫坐标為企業員工數、縱坐标為企業銷售額。通過線性拟合可以得到一個方程,這個方程中最關鍵的是 x 前的斜率 1.02,反映了企業規模與銷售額之間的增長關系。這意味着美國上市企業的員工數量增加兩倍時,其銷售額大約會增加兩倍多一點,大公司與小公司的銷售能力差異不太大。我們根據 3000 多家中國企業的數據得出來了的斜率數值僅為 0.83,明顯小于 1。這意味着在中國,企業規模翻倍時,銷售額增長不到兩倍,大公司比小公司的人均銷售額低。方程的系數代表的是單人的銷售額,是一個企業只有單一員工時的銷售額。中國企業的規模法則系數大于美國,則意味着中國企業的單人銷售貢獻高于美國企業。
規模法則還可以揭示企業老化的現象。我們依然采用的是企業銷售額和員工數這兩個指标,但是選取的樣本有所不同。我們在 1950 年到 2023 年這長達 70 年的跨度内,選取了所有創業時間只有一年的企業,對于這些初創企業而言,企業銷售額和員工數之間的斜率提高到 1.07 了,具有更強的規模效應,規模擴張時銷售額增長的速度更快。這也意味着,創業初期的企業增長潛力巨大,能夠實現快速突破。
我們還可以進一步研究不同年齡段的企業的表現,分析企業在 10 歲、20 歲、30 歲等不同年齡階段的斜率變化。同時,我們還可以考察銷售成本、管理成本等各類指标,繪制出不同的增長曲線,這些線條的斜率變化就揭示了企業随着時間推移時的不同表現。随着企業年齡的增長,企業的研發成本和管理成本越來越高,帶來巨大的消耗,導致企業的效率降低,呈現出典型的老化現象。
規模法則還可以用來直接對企業進行評估。我們提取了規模法則中一個叫作離差的指标,根據收集到的數據對企業進行統一的評估。在一個橫坐标為總資產、縱坐标為總負債的坐标系裡,我們可以看到 A、B、C 三家企業的整體資產規模和負債規模。直觀來看,C 企業的負債最高,似乎是最不理想的。然而,單純根據總負債評估企業是不準确的,因為負債高的企業往往資產規模也更大,尤其在中國,大企業往往更容易獲取資本。為了更加合理地評估企業,我們引入了負債率這一指标,斜率越高,負債率越大,企業經營狀況就越不理想。
我們還提出了一個全新的指标,對于中國企業實際遵循的規模法則而言,總負債和總資產之間呈 1.09 次幂的關系,是一個幂指數大于 1 的非線性方程。負債水平和資產規模的偏離程度直接影響對企業好壞的評估結果。若企業處于曲線之上,則意味着負債過高,表現較差;反之,若處于曲線之下,表現較好。
我們可以利用規模法則分别結合負債率、成本、利潤等拟合出一條直線,并用離差,即企業偏離直線的距離來評估每家企業的經營狀況。對于如銷售額和利潤這樣的正向指标,偏離曲線越大越好;對于如負債這樣的負向指标,則偏離曲線越小越好。利用這一創新指标,我們對美國 300 多家上市公司和中國 3000 多家上市公司進行了數據分析,對離差指标與傳統的比例指标進行對比,從而為企業評估提供了一種新的視角。
我們進行了一項大規模的實驗,對時間跨度長達 70 年的美國企業數據進行分析,通過利用離差指标評估企業的破產概率,來檢驗離差指标的預測能力。實驗證明,我們的離差指标比原有的比例指标用來預測企業的未來表現要更加可靠和合理。
那麼,企業的發展到底有沒有規律呢?如果以時間為橫坐标、總資產規模為縱坐标來觀察北美企業的數據,這些小點呈現出的似乎是無規律的上下起伏和波動,但是如果你仔細地觀察就會發現,這些小點形成的曲線表現出了緩慢的增長趨勢,恰好與美國 2~3% 的 GDP 增長率相吻合。
然而,這只是表面現象,真正的規律蘊藏在不同視角下對數據的特殊處理。當我們改變視角,将橫坐标選取為總資產,所有的數據點呈現出強烈的規矩性,形成了一條幾乎完美的直線。之前我們提到生物體代謝率和體重之間存在着穩定的關系,企業的淨收入和總資產的斜率為 0.85,展現了類似于生物體中的克萊伯定律。
基于這個定律,我們可以推導出企業周期、運動頻率等一系列要素與企業規模之間的關系。随着企業規模擴大,資金的周轉頻率和人員周轉頻率會降低。企業的壽命越長,平均而言,員工在企業中停留的時間就會越長。
在企業中的水缸模型裡,流入水缸的部分有兩個項目,一是淨收入,二是貸款,流出水缸的部分是企業發展所需的各類成本,構成了企業的财務平衡方程。财務平衡方程和規模法則這兩個第一性原理結合在一起,就推導出來企業生長方程。我們可以看到對于美國大多數的傳統企業,如可口可樂,其增長曲線與這個生產方程能夠很好地吻合,但是企業畢竟不是生物體,其成長受市場約束和個性化因素的影響,像蘋果這樣的高科技公司,往往就因被投資者看好、獲得大量資金支持,而偏離正常的增長軌迹,增長速度明顯高于市場平均水平。
在中國,也有百分之六七十的企業的增長曲線是與這個方程相吻合的。中國和美國的企業增長曲線之間存在着一個巨大差異:美國企業的增長曲線趨于平穩,而中國企業的增長曲線在上漲之後會有微微跳起的趨勢。這一差異的原因在于中國企業的借貸模式,中國企業總債務與總資產的斜率是 1.09,且公司越大,負債率越高。在美國則不會有這種現象,大小公司的負債率都差不多。
城市中的規模法則
為什麼我們要關注城市?全球超過 50% 的人口都已經居住在城市之中了,城市化進程日益加快,特别是中國,許多小縣城已經轉變為初具規模的小型城市。随着城市化水平的提高,城市的發展也逐漸展現出兩面性,一方面是城市的輝煌和繁榮,另一方面則是環境污染等負面要素。規模法則就可以幫助我們去研判在城市的發展過程中,其财富水平、科技創新等方面會發生何種變化。
當我們去看張家口、石家莊、北京這三座城市,是否可以說北京就是一個放大的張家口或者擴大的石家莊呢?這是我們思考規模法則的起點。以 500 多個美國城市的實證數據為基礎,我們将城市總人口作為規模指标,分析城市 GDP 的變化。數據顯示,城市規模與 GDP 成正相關關系。城市每擴大 1 倍,GDP 會擴大 1.13 倍。這就是現在很多年輕人願意留在大城市的原因,因為随着城市規模的擴大,人均 GDP 在上升,盡管大城市同時也伴随着犯罪率、疾病風險較高的問題。
規模法則涵蓋了眾多指标,且在不同國家的城市中都呈現出類似的規律。城市不僅是人口的聚集地,也是基礎設施的載體。以美國城市為例,其道路總面積與城市規模的 0.85 次幂成正比,這得益于大規模城市的高聯動性,共享道路面積大,因此對于道路面積的增速沒有較高的需求。
規模法則中的方程指數可以分為三類:大于 1、等于 1 和小于 1。指數大于 1 的通常是與人類互動密切的指标,如 GDP、科技創新、專利數量、犯罪率等等。這意味着城市越大,人均的積極性越高、專利數越多、犯罪率越高。指數小于 1 的則是與各類基礎設施相關的指标,如加油站數量、城市管道長度等等。這意味着随着城市規模擴大,人均基礎設施的數量逐漸減少。指數等于 1 的是與人口數相關的指标,如平均用電量等。
我們提出了一個模型去解釋為什麼城市中廣泛存在規模法則,出發點是人是城市的主體。城市中的人口不是固定的,除了睡覺的時候,絕大部分時間都在流動。因此,我們提出了 " 活躍人口 " 的概念,代表着城市中流動的人群,白天可能體現為工作人口,夜晚則轉化為居住人口,将二者平均混合即可得到相應的活躍人口。
我們将活躍人口作為建模的基本單元,遵循匹配生長的原則。一個城市可能起源于一個小漁村、小社區,後來會不斷有代表活躍人口的節點,即活躍社區加入,新加入的節點只有在與現有節點足夠靠近的時候,才會被認為是有效的加入。有效加入的節點才能夠生長,形成中間密集、兩邊稀疏的人口分布模式,這與真實的城市數據非常吻合。
城市不僅要聚集人口,還需要形成創新的力量。那麼,創新從何而來?創新并非是刻意需要偉大的發明抑或理論,從大尺度看,它和随機的化學反應類似,是人和人之間思維的随機碰撞。所有創新和财富創造的根源都在于人和人之間的互動。很多城市中的咖啡屋、車庫空間,就是為人們提供了互動的空間,從而催生科技創新,形成财富。
人口不是孤立存在的,而是彼此之間形成互動,從而構成一個簡單的網絡。随機形成的互動網絡,與節點數成二次幂的關系,但這一互動網絡并沒有考慮到人與人之間互動的成本。在實際生活中,人們的互動會受到物理距離的限制,特别是在沒有現代化高速公路的過去,人們的活動範圍非常局限。
在現代化的城市裡,我們的互動模式顯然不是随機的,但也不像網格般規整,高速公路的蓬勃建設使我們的社交網絡得以跨越空間。我們假設所有的人類互動形成的創新和财富創造都沿着路網進行,這說明道路路網與經濟活動之間有着非常密切的聯系,路網構成了我們人類經濟活動的界面。
人類活動的節奏與城市規模也有關系。研究發現,城市規模越大,人們的步伐會越快。在北京、上海這樣的大城市,上班高峰期地鐵裡擁擠不堪,人們都行色匆匆,慌裡慌張。在倫敦,還會有專門的快速通道,讓人們得以快速通過。同樣地,城市規模越大,手機的使用頻率越高,人們的溝通強度越高。大城市迫使人類生活節奏加快,變得越來越繁忙,這也是規模法則的推演和體現。
刺猬是我特别喜歡的一個搖滾樂隊,他有一句歌詞叫 " 社會是傷害的比賽 ",我深有體會。當人和人之間形成互動時,除了會帶來創新想法和财富來源,還會帶來矛盾和摩擦。因為人際關系的發展背後是熵的產生,城市發展到一定程度,一定會将這些產生的廢棄物排出去,在數據上即體現為二氧化碳的排放會随着城市規模的擴大而增加。
與生物體和企業一樣,我們也可以為城市建構出一個水缸模型,方程指數為 1.15。但與其它二者不同的是,基于初始條件和參數設定的不同,城市增長存在着兩種可能性:一是實現超速度增長,在有限時間内形成人口的超大規模爆發;二是伴随着人口增長產生的大量垃圾無法消化,基礎設施建設跟不上需求,整個城市遭遇發展瓶頸,乃至完全崩塌。
為了調節這兩種可能性,研究者又推導出來一個波浪式的城市增長規律。人類歷史上眾多城市曾面臨消亡,但科技革命的出現遏制了這一趨勢。換句話說,創新不是原因,而是結果。城市發展的一角在崩塌,于是人們不得不尋求新的突破。科技創新就會改變城市發展的方程系數,提升人們的幸福感,使得城市發展邁入了新的軌迹。
周期性的崩潰和重建并非無序,而是遵循着一定的定量規律。科技迭代的周期越來越短,從最初的上百年縮短至幾十年,再到現在只需要幾年。用跑步機來做比喻,人們不僅是在跑步機上奔跑,而且還會不停地跳到更快速的跑步機上奔跑。當我們玩命地加速,不停地切換到更快速的跑步機上,就會面臨一個不可回避的問題:最終哪裡是終點?
科技進步的不斷加速是在接近人類歷史中的技術奇點,一旦到達奇點,超級人工智能和環境崩潰可能同時發生。問題的根源就在于我們剛才所說的,互動是一個傷害,一切互動都伴随着熵增加。老子在《道德經》中所形容的理想國," 鄰國相望,雞犬之聲相聞,民至老死不相往來 ",似乎是暗示我們停止或減少人類間的互動,但這并不意味着我們要退回原始的生活模式,人類無法一直停滞不前。
////// END //////
混沌文理院七期——以思想抵抗虛無,回答人生大問題
以下為混沌文理院七期學習課表。點擊 " 閱讀原文 ",立即報名。