今天小編分享的教育經驗:斯坦福大學傑出教授葉蔭宇:AI智能決策的真正威力,歡迎閲讀。
以下文章來源于華夏基石 e 洞察 ,作者葉蔭宇
第三期華夏基石數智時代領導力特訓營熱招中!
作者 | 葉蔭宇,首位馮 · 諾依曼獎華人得主,美國斯坦福大學管理科學與工程系及計算數學工程研究院的傑出終身教授
來源 | 華夏基石 e 洞察,管理洞察
咨詢合作 | 13699120588
本文根據葉蔭宇教授在 2024 華夏基石第十一屆十月管理高峰論壇上的演講整理,文章僅代表作者本人觀點(未經本人審核)
葉蔭宇,首位馮 · 諾依曼獎華人得主,美國斯坦福大學管理科學與工程系及計算數學工程研究院的傑出終身教授,斯坦福管理科學與工程系工業聯盟主任,上海交通大學人工智能研究院首席科學家、香港中文大學深圳研究院首席顧問科學家
非常感謝華夏基石給我這個機會跟各位見面。我是斯坦福大學的,現在也是上海交通大學、香港中文大學深圳研究院的兼職教授。今天匯報一下我是怎麼擁抱人工智能的。
決策智能——人工智能的落地目标之一
怎麼擁抱人工智能?對我們來説就是要人工智能落地。怎麼落地?我覺得要把決策,不管是宏觀決策還是微觀決策,都能夠智能化,讓 AI 這個工具來幫助我們。
我是做運籌和管理研究的,或者稱之為 " 數學優化 "。運籌學,OperationalResearch,其實我們國家很早就有華羅庚先生研究優選法,這是我的專業之一,後來錢學森先生也做了很多運籌學方面的工作,也是我的學術範圍。1982 年我去美國讀書,非常有幸和斯坦福大學運籌學研究者們一起工作。
(一)人工智能的三個漸進層次
我認為人工智能有三個漸進階段。
第一,感知智能。是指将物理世界的信号通過攝像頭、麥克風或者其他傳感器的硬體設備,借助語音識别、影像識别等前沿技術,映射到數字世界,再将這些數字信息進一步提升至可認知的層次。類似于将各種信号通過傳感器等東西,輸入到我們的大腦,存儲起來。
第二,認知智能。是指 AI 系統基于既有的知識體系,通過處理和理解感知到的信息,來實現對復雜問題近似人類認知過程的解釋和預測能力。這個過程是做一些簡單的分析。
第三,決策智能。AI 系統根據認知分析和推理結果,高效靈活地結合環境和上下文信息,全面評估可能性,做出基于特定目标的最優決策的能力。AI 幫助我們的決策更加優化,風險最低。這是人工智能的第三個階段。
(二)決策問題的核心特征
這三個階段緊密關聯,但決策問題不同于一般的簡單的感知和認知,有着區别于感知及認知問題的鮮明特點。
1. 目标 / 精度導向
決策通常有清晰的目标與結果,帶來明确且常常易于觀測和評估的價值創造,因此人類對于提升決策效果的追求幾乎是永無止境的,也使得最優化幾乎成為決策的代名詞。決策的精确度成為核心訴求。
2. 因果 / 可解釋導向
決策問題通常高度依賴對于可解釋的因果關系的識别與理解:一是決策效果出現偏差時,可快速歸因與調整;二是決策通常與責任緊密相關,因此需要明确的因果關系做責任判斷。
3. 魯棒及復雜性要求
由于決策結果對于決策復雜環境及對象有極為直接的影響,因此決策過程中,對于底線的保護以及對于穩定性的要求幾乎與極大化價值相同重要。我們的決策必須要有一定的魯棒性(robustness,就是系統的健壯性。它是在異常和危險情況下系統生存的關鍵)。
4. 時間 / 資源敏感
由于強烈的利益導向,決策問題通常藴含有明确的成本收益考量,再加上大多數現實世界中的決策都有時間限制,因此決策問題常常需要在較少的時間和資源下得到良好解決。
(三)純粹的學習路線類智能的明顯缺陷
基于復雜決策問題的以上幾個核心特征,純粹的學習路線(幾乎已成為 AI 的代名詞),在面對復雜決策問題時有明顯缺陷。學習(Learning Algorithm)型算法面對的關鍵挑戰有以下幾個方面:
第一,深度學習等學習算法體系,雖然在部分復雜問題上能夠提供比傳統的優化方法更好的近似解,但是在現實生活中更為常見的決策問題上,卻難以提供符合要求的高精度解。
第二,深度學習等學習算法體系是典型的黑箱機制,雖然近年來也有很多在訓練過程中引入可解釋機制的探索,但其根本邏輯難以支持完善和清晰的可解釋性,很難滿足高價值決策場景下的要求。
第三,受限于黑箱機制以及缺乏清晰的邏輯推理過程,如深度學習等學習算法體系在復雜環境下,無法提供清晰的邊界定義以約束解的範圍,導致出現災難性結果的可能性大大增加。
第四,由于缺乏清晰的可控邏輯結構,以及對于數據本身的高度依賴,如深度學習、大模型等學習算法框架的訓練,對于能源及算力等資源的消耗遠遠超出預期。而決策問題既普遍存在,又通常藴含清晰的投入產出比邏輯,因此僅從資源投入角度看,AI 技術對決策問題的廣泛支撐都很難在當前的學習算法框架下實現。
人工智能及其落地:讓人工智能做一些人類做不到的事
下面會舉一些例子,講講大模型以及人工智能和怎麼落地結合起來。
決策認知,不是簡單的大模型就可以處理的。有一個非常微觀的決策問題,在運籌學界也是非常經典的問題,就是背包問題。我有一個 5 公斤的背包,有 5 個物件,每個物價有兩個屬性,第一,重多少,第二,價值多少。應該把哪五個物件放在這個背包裏面,使得背包裏產生的總價值最大,但是又不超過我們的產能?可以把這個問題看成 5 個項目,資金投資只有 500 萬,要投到哪幾個項目中?也可以看成是生產線問題,有某些產品,先生產什麼,後生產什麼,怎麼決策是最優的?
我們怎麼能智能決策呢?通常建立一個數據模型,比如説這五個物件,我會分别定義一個變量,這個變量要麼取 0,要麼取 1。取 0 就是不放在背包裏,取 1 就是放在背包裏。我們要什麼?要使總價值最大,通常是目标函數最大。但是必須滿足一些約束,這些約束是什麼?如果決定哪些放在背包裏,裏面的重量不能超過 5 公斤,都給你回答好了,這是數學建模。在座各位的孩子在中學或者小學,現在都有數學建模的項目或比賽。
那麼,人工智能,或者説 GPU 能不能幫我們解決背包問題?我們當時問到 ChatGPT,它説這是經典的背包問題,可以用一個數學的優化問題來解決。這一句説明它已經感知到了。但是 ChatGPT 的回答是,把 1、3、5 放入一個背包中,總價值達到了 53 元,也就是説投資這三個項目。1、3、5 放到背包裏,總重量是 6 公斤,就要超過背包的承重了。所以,這個回答是錯誤的。僅僅憑經驗感知我們找不到問題的最優解。
2023 年,同樣問這個問題,還是給了錯誤的回答,我們告訴它這個回答是錯誤的,要重新思考一下。它説把 1、2、5 放進去。這樣產生的價值是 43 元,重量是滿足了,只有 4 公斤。但這個問題最優的答案是什麼?是把 2、3、5 放進背包裏,總價值 45 元。
這説明什麼問題?説明 ChatGPT 目前的大模型也不是萬能的,這還只是放 5 個物件的問題。我們必須要進行進一步的調教,要引用大規模的優化的求解功能或者算法來把最優解找出來。現在華為排產,10 萬個零件,怎麼找到最優解?深圳現在經濟發展得很好的是跟 AI 相關的產業,刺激了大量的 GPU 生產商、芯片商。需要有芯片就必須有電路板,到深圳去看,到東莞去看,生產電路板的企業訂單大量增加,每天要排 1 萬個訂單的量,怎麼排到各個生產線上,每個生產線就像一個背包問題。5 個都回答不了,上萬個訂單排到 100 個生產線上,哪個訂單放在哪個生產線?按照什麼順序去生產?這是人力達不到的。
所以,大家不要説我們希望人工智能代替人,或者比人做得更好,我們要有更高的要求,我們要讓人工智能做一些人類做不到的事情。什麼是優化?人工智能怎麼落地?我們一定要建模,人達不到的事情讓數學去幹。我們要求解,怎麼把實際問題,把剛才説的目标,變量,約束,都組織起來,用數學的邏輯把它聯系起來?其實這套方法是走在人工智能之前的。
1975 年諾貝爾經濟學獎得主,一位是前蘇維埃的經濟師,列奧尼德 · 康托羅維奇,一位是美國的數學和經濟學家,佳林 · 庫普曼斯。他們将數理統計學成功運用于經濟計量學,把資源最優利用這一傳統經濟學問題,由定性研究和一般定量分析推進到現實計量階段,對線性規劃方法的建立和發展做出了開創性貢獻。他們發明了這套智能決策的模型——數學優化和數學規劃法,獲得了 1975 年諾貝爾獎,但是他們當時沒有算法。
剛才我説了,要把 1 萬個,甚至百萬個東西分配到幾萬個背包裏,要有一套比較快速的算法來把它找出來,窮舉法是不行的,必須要有精密的數學算法。這個算法在模型建立之後終于出現了。
圖片中間這個人是 G.B.Dantzig,發明了解這套數學優化的算法。當時提出這個算法的時候還沒有計算機,并不是有了計算機才有了算法,事實上數學優化算法一直是人工智能發展的重要驅動力。算法是走在計算機之前的。數學優化算法很早就是智能決策的基礎。計算機使得計算效率極大提升,邏輯的計算,智能的計算,才能最快有結果。
我非常有幸,1982 年到了斯坦福以後,G.B.Dantzig 就是我的導師。1975 年他們兩位得諾貝爾獎的時候,專門把我的導師請上了台,説如果沒有他的方法,我們的數學模型就是一紙空文,可惜諾貝爾沒有給數學的獎。
優化求解器:優化算法的核心工具及實現智能決策的關鍵計算引擎
數據變量,目标約束,數學模型跟算法是分不開的,包括今天的大模型,其訓練過程就是一個尋優的過程,解一個大型問題,就是一個優化問題。優化建模為復雜的決策問題提供了完善、精煉的解決辦法,高度符合,再加上算法求解器,使得我們的方案完全機器化、自動化。其實整個 AI 的發展是和算法的湧現離不開的。
不管是簡單的回歸,機器學習,人工智能的代表性的東西,比如 Alpha GO,也是強化學習,也是優化的算法,每一步的發展都跟算法的提高有關。
算法一定要符合我們的模型,我們的規律。G.B.Dantzig 搞的這套優化,特别是那個算法編譯成計算機以後,數據進來了,幾秒鍾就把優化的解找出來了,不需要通過語言去描述了。這個東西叫求解器,一直是高科技領網域發展的核心底座,或者説,算法就是芯片。有很多人説,為什麼我們國家芯片不夠領先?是因為工藝不夠,材料不夠?其實還有一個很落後的,就是設計不夠。Snyopsys 是美國最大的芯片設計公司,其芯片的設計最底層就是用到了優化。為什麼?比如電路板,器件放什麼位置,線路怎麼走,都是有邏輯的,都是要優化的。這其中用了非常強大的優化算法和求解器。化工生產領網域最有名的軟體—— Aspen,最核心的東西就是優化,就是求解,因為它解決的都是物理過程,化學過程中的求解問題。流體力學也同樣有這樣的求解需求。
Space X 用到了強大的優化算法。Elon Musk 回收火箭的時候失敗過好多好多次,後來找到了斯坦福的優化專家,我們一起提供了最好的優化算法。火箭回收每時每刻都要調控,因為周邊的環境都在變化,不可能全在預測之内,要實時進行控制。還有電網、供應鏈問題,包括 CAD,也離不開優化算法。所有這些工業軟體的底層都有智能的優化軟體。
既然優化求解器是我們工業軟體的底層,我們國内現在水平怎麼樣?非常高興地講,從 2019 年以來,國内優化軟體的發展已經跻身到世界前列。我有兩位斯坦福培養的博士生,回國建立了一個公司 Cardinal Operations,杉數科技。為什麼建議他們回國發展求解器?因為都是歐美市場上的領先,我們國家自己沒有能力去做。
華為所有的生產排產用到的工業軟體,起推動作用的是 IBM 的求解器。2019 年華為上了黑名單,人大有很多是給華為做法律顧問的,我給他們做供應鏈,包括生產制造的顧問。因為我是 2002 年回到斯坦福,那一年華為在跟思科打官司。我是華中科技大學畢業的,華為也有很多華中科技大學畢業生,也有我的好朋友,所以跟華為建立了比較好的關系。華為上了黑名單,突然工業排產軟體用不了了,因為美國下了禁令,不能用他們的軟體。他們找到我,結果我們搞了一個替代軟體,這個軟體當時還沒有趕上國外的水平,但是反而比國外用得好。因為我們給的是源程式,美國的檔案傳輸都是要通過寫成檔案放到硬碟,再讀進去,我們給出的,可以把求解器,或者優化器,跟排產的信息系統無縫聯系起來,數據以光速傳進來。
這給了我們信心,2019 年終于推出了自己的商業求解器。以前都是非常大的數據公司領先,在這以後,優化求解,算法的求解器就有了非常好的生态環境。國内有很多公司,包括阿裏,華為,聯想,都在開發求解器,形成了比較好的競争環境,使我們跻身到世界前列。
我們求解優化問題,有很多很多類型,我們在很多類型中處于求解器的第一名。美國建立了一個擂台,搜集了幾萬個優化問題,大家把自己的求解器給它,它進行評審。同樣的問題在同一個機器上,就是求解器的算法不同,誰算得快,算得好,就得金牌。我們的商業求解器得到了 6 個金牌,4 個銀牌,美國最好的求解器得到 5 個金牌。這就像奧林匹克競賽,我們至少跟他們平手,甚至很多方面比他們好。國内的求解器都起來了,形成了非常好的生态環境,至少我可以驕傲地告訴大家,在優化求解器方面,中國不輸于其他國家。
在我們的努力下,很多問題的速度提高到 60 倍,有的提高到百倍,甚至提高到萬倍。中國人雖然硬體不夠,GPU 不夠,但是比較聰明,會想點子。設計優化算法就是一個動腦筋的問題,完全是靠自己的智力來發展。
這也得到了國際的承認。原來有很多很多問題,比如歐洲的鐵路運輸問題,谷歌的問題,美國多層供應鏈的問題,很多國外的求解器解不了,但是我們能夠在秒級的範圍内解決掉。
擁抱 AI,擁抱智能決策
AI 能夠幫助我們做一些什麼呢?AI 能幫助我們建模,大量的數據,大量的邏輯關系,包括企業家們從頂層去想的一些問題。我們開發了一個幫助企業家讓大模型落地的工具。企業家的幾句話,點名了約束及變量,我們可以很快地把數學模型建立起來,然後再索取數據。
比如我們收到這樣的需求:" 計劃部門每天都要補貨,先把客户需求滿足了,補貨優先級有很多考慮,物流車隊每天資源也不一樣,工廠别占用太多倉儲成本,周轉要好,運輸成本要控制。" 我們的求解器可以馬上給你提示,你需要做一些什麼事情。企業家可以直接跟我們的大模型談話,我們檢出模型,甚至把 Code 寫出來。電路廠制造商,給了問題,自動存儲數據,馬上幫你算出來。而且我們還幫忙做預測,比如商品消耗,周邊市場的情況,給企業家提供建議。
目前,我們已經有應用的實例。我們國家也遇到了火箭回收、飛船回收的問題,這是典型的優化問題,對求解的時間要求非常高,毫秒級就要測出來,因為要調節角度。我們已經解決了這個問題。
另外,優化求解器,人工智能已經成功用到了南方電網的電力調度。原來人完全憑經驗做,現在南方電網有幾個省,幾萬個電機,有風能,有光伏,有各種各樣的新能源,具有高度的不确定性。作為電力市場,發的電一定要和用的電匹配起來,時時刻刻要調控,哪些應該開,開多大,哪些應該關,這時人力已經達不到了,因為不斷在變化。我們原來用的是國外的求解器,非常高興現在已經形成了國產的替代。國產的求解器在南方電網已經運營兩個多月了。
再舉個例子。列車運行圖是列車在區間運行及在車站到發時刻的技術檔案,其編制是決定鐵路運量的關鍵一環。高鐵運行的濟效益主要取決于排班列車的數量,每增加一對列車每年營收增加近億元。大家都乘坐高鐵,是否了解原來列車排班是怎麼排的?完全是人工的,傳統編圖方式,人工編圖,效率低,編制一次耗費數周。通常排一個班出來,根據四季需求不同,排多少車,怎麼停,就畫一張圖。這麼多班次怎麼排?安全第一,在同一個時間點,同一個空間點,兩個列車絕不能同時出現。出發時間,在中間的每個時間,到了某一個站以後,停在哪個站台,全部要梳理出來,而且列車間的時間差不能超過安全保障。現在用新方法,基于優化算法的自動圖編制,在一千秒内就能把班排出來,保證安全。你想排多就可以排多,想排少就可以排少,這樣可以為國家節省多少能源?疫情時很多高鐵是開空車的,如果知道需求減少了,能很快排出班,是不是能夠少跑一些空車,節約很多能源。
現在中國最大的煤炭調運港口,是杉數科技在為他們服務,把人工智能落地到港口的調配和調運上。剛才講到的華為排產的問題,速度有了很大的提高。
我認為 AI 不是復制人工智能,而是超越人的智能,人做不到的事情我們要讓人工智能做到。現在的供應鏈管理,怎麼定價,怎麼庫存?還有發動機制造,為什麼航空發動機搞不起來?很大原因就是設計問題,設計問題也是優化問題。用我導師的話説,The algorithms that turns the world,地球現在是靠算法來推動運轉的。
我覺得企業家們應該擁抱 AI,擁抱智能決策。而且現在正是在落地的時候,通常一個新技術都有接納生命周期的,如果邁出一步你可能就捷足先登了。希望企業家們抓緊時間,Take Actions Now。
謝謝大家!