OpenAI研究員肯尼斯·斯坦利：我從AI研究中，發現了人類思維的根本BUG

今天小編分享的教育經驗：OpenAI研究員肯尼斯·斯坦利：我從AI研究中，發現了人類思維的根本BUG，歡迎閲讀。

在混沌 " 一 " 思維創新嘉年華活動現場，有人問肯尼斯 · 斯坦利：" 在公司裏創新扮演着什麼樣的角色？管理者或領導層，迎接 AI 應該做什麼準備？"

他説：" 對一些公司來説，不必整個公司試圖創新，而是公司的一部分考慮創新，這對公司的某些器官或組織來説是一種保護。公司今年如何增加收入？如何增加利潤？提出這種問題，實際上就會抑制創新。"

" 我們研究人工智能的時候，發現了一個人類根本性缺陷。即‘單一的目标導向思維會阻礙創造力和創新’，這對社會而言是一個極其嚴重的問題。"

" 人類在人工智能或機器學習領網域的許多基準文化可能已落入歧途。算法的強大力量，并不在于當你真正建立一個目标時，它們做事情的能力；而在于，當你沒有設定目标的時候，它們做事情的能力。" 肯尼斯 · 斯坦利（Kenneth Stanley）説。

肯尼斯 · 斯坦利（Kenneth Stanley），OpenAI 研究員，全球創新思維和前沿科技領網域的代表性專家、人工智能科學家。他曾任中佛羅裏達大學教授，深耕機器學習領網域。他曾是 Uber 人工智能實驗室的創始成員，在行業内具有卓著的影響力。

在對前沿算法的研究的過程中，他意外收獲了對人類約定俗成的思維方式的全新颠覆，在人工智能研發領網域取得了飛躍式的突破和進展，產生了一系列惠及人類的偉大創造。

什麼是 " 尋寶者思維 "、" 踏腳石模型 "、" 新奇性探索 "？

今天，肯尼斯 · 斯坦利做客混沌 " 一 " 思維創新嘉年華活動。帶來議題《為什麼偉大不能被計劃》，帶你探讨人工智能帶來的啓發，習得創新的元邏輯。

混沌在上海滴水湖洲際酒店舉辦 " 一 " 思維創新嘉年華活動。打造一整座島、兩天兩夜的共學場、2000 位混沌同學參與其中。邀請張穎、李志飛、傅盛、葉軍、韋青、OpenAI 研究員……AI 全明星陣容空降授課，更有7/8-7/9 兩天線上直播免費開放，從4 大視角，為你講透大模型時代的底層邏輯。

以下為分享筆記：

授課老師｜肯尼斯 · 斯坦利（Kenneth Stanley），OpenAI 研究員，人工智能科學家

編輯丨混沌商業研究團隊

支持丨混沌前沿課

目标悖論

很榮幸能跟大家分享、交流。我的研究領網域是開放性（open-endedness）機器學習。我們都知道，大多數機器學習算法，往往預設了一個優化目标，達成目标很重要。開放式算法與此不同，這一算法沒有終點。它讓機器具有無限的潛力和持續的創造力，可以在沒有明确目标或終止條件的情況下不斷演化和產生新的結果。

那什麼才算開放性？什麼進程是永遠不會停止的？舉兩個現實世界中我們能體會的例子，它們非常具有啓發性。

第一個例子是進化。從地球上的第一個單細胞開始，它不斷分化并創造，經歷數億年甚至十多億年，創造出了人類等等生物，進化的腳步永遠不會停止。

第二個例子是文明。人類出現後，你會看到思想和文明的迸發，這個過程是宏大的，不可思議的。從火種和車輪一直演變到現在的計算機、空間站，文明不斷演化，一直持續到今天。它不會停留在某個具體的目标上，只會持續向前發展。從某些方面來看，文明其實是人類最重要的創造發明。不斷再造周圍世界的能力，是人類智力的重要組成部分。

我們都是開放性進化的產物，而人類作為產物本身又創造了文明。

在這樣的背景下，我想同大家分享一個故事。我們研究人工智能的時候，發現了一個人類根本性缺陷。即 " 單一的目标導向思維會阻礙創造力和創新 "，這對社會而言是一個極其嚴重的問題。

不僅是機器算法，你會發現人類所做的一切，幾乎都是以目标為導向的。但目标在我們處理重大事項時，有時反倒是無用的，無法幫我們實現創新。

舉個例子，10 多年前我在大學任教時，建立了一個網站 Picbreeder。它可以幫助人們 " 繁衍 " 圖片——用一張圖片作為母圖片，可以 " 生出 " 與之類似的許多子圖片。這個技術和現代的影像生成技術是不同的。

如果你準備在 Picbreeder 繁衍圖片，可以先自選一張圖片，這張選中的圖片就是下一代圖片的父母。你可以轉身去忙别的事兒，Picbreeder 不需要任何指令就會繼續繁衍，到最後，出現的圖片可能是一只蝴蝶，一個頭骨，甚至是木星。這個過程令人震撼。

我需要向各位解釋一個非常重要的機制，它被稱為分支（branching）。如果用户确實繁衍出一些有趣的東西，并且通過網站保存這一影像，相當于把影像公開發布。那麼其他人就可以把這張圖片為起點進行分支演化，也就是用這張圖去繁衍，獲得新圖片。這意味着，在前人的基礎上繼續發現更多新事物。

這就出現了生物學家口中的不斷發展的系統發育。就像一棵生命樹，這些生命之樹末端的葉子就代表着新的發現，而這些都是以一種看似偶然的方式被發現的。

大家可以看下面這張幻燈片上的圖片，為什麼會繁衍出現這些圖片？我得出了一個驚人的發現。

有些人認為，想最終得到一只熱帶鳥的圖片，只要選擇看起來最像熱帶鳥的斑點，通過繁衍就可以得到想要的結果。但有趣的是，事情不是這樣運作的。

如果你想用 Picbreeder 生成一張熱帶鳥的圖片，肯定會失敗，這就是以目标為導向的思維方式。能讓我們繁衍出鳥類圖片的東西，往往看起來并不像鳥。我們的世界是復雜的，臆斷只會導致失敗。一些人按照自己的想法去繁衍圖片，最終的結果令他們感到沮喪。

那麼，如果将它們作為目标來搜索無法成功的話，怎樣做才能成功呢？我認為這就是事情變得更加深刻的起點。

再以 Picbreeder 為例回答這個問題。我用一張外星人臉的圖片，繁衍出一輛汽車的圖片。

首先有一個非常重要的前提，我最初的想法并不是繁衍出一輛車。當時，我只是看到了是一張像 E.T. 一樣的外星人臉，覺得繁衍這張圖片一定很有趣，可以得到更多的外星人面孔。

神奇的事情發生了，通過分支出來的圖片，外星人的眼睛開始向下移動，這時我意識到外星人的眼睛正逐漸變成輪子，可能會演化出一輛汽車。

在演化的過程中有兩個條件必須成立。首先，必須有人去完成我永遠不會做的事（比如繁衍出一張外星人圖片，供我選擇）；其次，我不能帶着目标去做事。只有這樣，我才能獲得我想要的發現。

讓人震驚的是，這種繁衍方式，不是巧合。Picbreeder 數據庫記錄了每一張圖片的繁衍過程，記錄了每一張熱門圖片背後的 " 踏腳石 "，我們能夠确切地知道每張圖片是怎麼來的。Picbreeder 網站上的大多數熱門圖片，都有着完全相同的繁衍路徑。

這其中藴含着一個非常奇怪的寓意，你只有不帶目的的尋找才能實現目的。這與我們的直覺相違背，也與我們對現實生活的認知相悖。

如果這條理論成立，人們就不能通過對目标的尋找來發現任何東西。

實際上，這條理論并不僅僅存在于 Picbreeder 之中，整個現實世界都是這樣運作的，所有的復雜空間都有這個性質，這是一個非常重要的發現。

如果我沒有通過外星人的臉發現那輛車，我就永遠不可能意識到這一點，也不可能創造出後來的算法，也永遠不會寫《為什麼偉大不能被計劃》這本書。

當然，這也是一個可以用來理解 " 開放性 " 的例子，因為你永遠不會知道，你走出的每一步會帶來什麼結果。

現在有更多的證據來證明這條理論。例如，這張圖片中的蝴蝶和頭骨是由随機斑點演化而來，各進行了 74 次、和 90 次迭代。但在另一個實驗中，我們把生成這些圖片當作目标，讓 15 個孩子通過自主選擇來生成這些影像，最後經歷了 3 萬次演化才得到了目标影像。這個結果是多麼的瘋狂。

我個人認為，這表明人類在人工智能或機器學習領網域的許多基準文化可能已落入歧途。算法的強大力量，并不在于當你真正建立一個目标時，它們做事情的能力；而在于，當你沒有設定目标的時候，它們做事情的能力。

如果你的目标是生成一張蝴蝶、頭骨照片，這個目标會導致你忽略了這些踏腳石，事實上你更應該關注這些踏腳石，我稱之為目标悖論。目标悖論的含義是，即擁有一個目标，會妨礙你實現目标。

這裏需要澄清一點，目标悖論并不是要你沒有目标，而是説當你沒有目标的時候，更有可能實現創新。目标只會在簡單的、非欺騙性空間裏生效，解答容易的問題，有一個适度的目标并沒有錯。當你放棄目标的時候，你可能會做成偉大的事情，但是你不會提前知道這件事情是什麼。

這就是我們面臨的選擇。

這個世界上，不可能有人在完成一件驚人的事情的同時又有一個目标。我們希望世界能以這種方式運作，但事實并非如此。這不僅是 Picbreeder 的運作結構，也是現實世界的運作結構。

人類總是在适度的目标中成功完成任務，相信并由此推斷這一思維模式對一切都有成效，這是根本錯誤的。覺得每件事兒都會圍繞目标運作，這是人類文化中產生的一種誤解。

"新奇式搜索算法"和 " 發散尋寶"

在發現這一理論的時候，我還在研究計算機科學或者人工智能，對這個發現的興趣完全是在算法範圍内的。我和同事喬爾 · 雷曼在思考，也許我們可以發明一種新的算法，讓它以非常反直覺的方式工作，不設立任何目标，我們稱之為 " 新奇式搜索算法 "。

舉個例子。我們想訓練一個兩足行走機器人走路，想法是機器人走得越遠越能獲得獎勵。傳統機器學習觀念認為，必須一小段一小段地走，機器才能學會走路。我們的訓練理念是讓機器人做一些與此前不同的事情，想法越新奇越好，這種探索未必是正确的，但只要機器人采用了一種新方法，就能獲得獎勵。

最後實驗證明，新訓練理念的最好結果要遠遠優于傳統版本，這種違反人類直覺的結果令人震驚。學會走路的機器人，不一定看起來像在學走路。

新奇式搜索算法催生出了一個新的領網域，高質量多樣性算法。通過把有趣與高質量目标結合，找到多樣性選項中的最佳結果。

在一個非目标導向的世界裏，人類的本能之一就是想要追随有趣的事物，因為有趣可以驅動進一步探索。

簡單來理解，要想實現最高目标，必須先願意放棄目标。只有當我們沒有真正想着這些目标時，或者當别人沒有遵循你所謂的正确的道路以及符合你的利益時，才可能實現目标。

如果人們只做自己認為正确的事，就會忽略掉那些真正能幫你解決問題的 " 踏腳石 "，忽略這些能夠奠定偉大基礎的東西。就好比，發現一張外星人的面孔，為繁衍出汽車圖片奠定了基礎。

從目标悖論的角度來看，合作可以導致趨同和共識，但是也将消除通向偉大事物的 " 踏腳石 "。協作的含義是什麼？當一群人一起進入一個房間，大家想要達成某種共識，想要找到某種正确的道路，這就導致了多樣性的缺失，也帶來了妥協。

有時在組織裏不達成共識也是很重要的，人們必須跟随直覺，才能到達某種地點。我稱之為發散尋寶。尋寶的人只是随便看，并不知道會找到什麼。發散是因為每個人都有不同的方向。

這樣的搜索過程沒有目标，只是憑直覺在荒野中漫步，去發現有趣的事物。有人會認為我在贊美随機性，并非如此，這一過程還是遵循一定原則的。舉個例子，人們在 Picbreeder 上選擇圖片不是出于随機，而是出于一定的喜好，而你的喜好一定不是随機的，而是由你的生活經歷決定的。

非目标導向的演化過程是非常有趣的，比如 Picbreeder 和新奇式搜索，進化和文明可以看作是一個發散尋寶的過程，它們也沒有最終目标，這才是現實世界的運作方式。

在發散尋寶的過程，收集 " 踏腳石 " 仍然是關鍵。

舉個例子，Picbreeder 的強大之處在于它運行的時間越長就會出現越多有趣的影像，這意味着我們可以找到更多有趣的事物。這就是踏腳石，這些圖片不僅可以用來解決具體問題，還能不斷發散、不斷繁衍，最終繁衍出一個具有很高價值的寶藏。

人工智能時代應該如何創新？

為什麼只有不設定目标才更有可能取得驚人的發現？這就是我們今天一直讨論的話題。我想通過《為什麼偉大不能被計劃》這本書，引起整個社會對這一問題的關注和讨論。

為什麼人們要用目标來定義每一次偉大的努力？目标給我們規定了每一步，指引我們每一次行動，這種想法無處不在。我個人認為它是有毒的，抑制了創造力。如果人類所做的每一步都是根據生活中的某個目标來進行的、評估的，從出生到退休，那這段時光太令人窒息了。

IT 技術的進步符合這種目标導向思維，人類制定性能指标，評估其表現，認為一切事物都必須向前發展。但如果我們只獎勵目标上的東西，就永遠不會發現有趣的技術。因為傳統思維帶有一種懲罰失敗的意味。

另一種選擇是獎勵有趣的東西，這種方式會讓一些人不安，但對另一些人而言卻是解放性的。人類擁有的最好技能，就是發現有趣事物的主觀本能。世界上所有的創新，都是因為人類有對有趣事物產生興趣的本能，它不是随機的，而是基于人生經驗的。

直覺會告訴我們什麼是有趣的事物。我們應該傾聽并讨論有趣的事情，即使讨論的一部分是主觀性的。需要再次強調的是，目标導向思維，在某種程度上是成立的，比如那種最有抱負的目标，比如你想變得富有。

20 世紀 40 年代產生的 ENIAC 是第一台計算機，這台計算機是怎麼產生的？實際上促使其產生的是真空管。在第一台計算機出現之前，人們已經研究真空管 150 多年了。有趣的是，如果人們直接對計算機感興趣而不去研究真空管，人類就不會有真空管和計算機。研究真空管的人并未将發明計算機當做目标，這再次體現了目标悖論。

再舉一個商業案例，二十世紀七八十年代出現了電唱機，盒式磁帶、音箱和各種盒式磁帶播放器，之後是随身聽、CD 随身聽和 iPod。iPod 是蘋果公司發布的一種革命性的音樂播放器，但蘋果的目标不是作出最好的音樂播放器，iPod 成了一塊通往 iphone 的踏腳石，最終那個引領性的產品是一部手機。

避免掉入目标悖論，超越狹隘的目标局限，這一能力對創新來説至關重要。

有人會好奇，在人工智能時代應該如何創新？從我目前的經驗來看，考慮到目标悖論、目标神話以及新奇性搜索算法，我會給大家六點建議。

第一，看到這條路的前景，也要超越眼前的道路。超越的眼光十分重要，我們要超越眼前的路，而不僅僅只關注是否能走得更遠。

第二，期待驚喜的出現。世界是具有欺騙性的，驚喜在等待着你，會發生的可能不會發生，而不會發生可能就會發生。

第三，準備好接受欺騙。即使看起來是在做正确的事情，結果也會是錯誤的，或者看起來是錯的結果卻是對的。所以，信念非常重要。可能所有人都會覺得你錯了，但事實卻會證明你所專注的事情恰恰是十分正确的。

第四，相信有趣的事物，質疑所謂的标準。人們喜歡設定标準，因為它們可以提供安全保障，這是一種評估形式。但人類社會并沒有給予有趣适當的重視，我們應該相信有趣的事情，換句話説，你需要相信自己的主觀判斷，憑借你自己的人生經驗。

第五，不要随波逐流，而要追随有趣。每當有任何抓眼球的事物出現時，人人都會随波逐流，但恰恰是那些不起眼的事物才值得我們率先關注，因為它們可能會創造巨大的價值。

第六，不起眼的事物可能帶領人們去到全新的領網域，即使當下我們未能察覺。這就是生活中人們必須接受的不确定性。

最後，還需要特别注意的一點。追求有趣的事物，并不能保證你一定會做出驚人的成就，你只是有取得成功的可能。所以，你必須學會接受一定程度的風險。如果你不想在生活中冒險，就做一些安全簡單的事情，這雖然不會給你帶來偉大的成績，但也能夠讓你取得相對不錯的結果，這只是個人的選擇而已，無論是否以這種方式成為真正的先驅，這兩種選擇都是完全可接受的。

「混沌 · AI 季優惠」混沌在線會員

倒計時 1 天，購買立享 700+ 好禮

為什麼值得加入？會員權益價值超 10 萬，包括：

1 套 " 一 " 思維認知結構，提升本質認知，追問本質的能力

500+ 經典商業管理課暢學，扎實培養軟技能成長，提升競争力

2 次小班私教課（美好作品探索營），刻意練習，高手反饋

50 次周六線上前沿課，高效獲取信息，避免脱節現實

10 次線下月賽打磨場，參加 or 圍觀，從高手身上學習

在混沌 APP，提升 AI 時代的必備的個人競争力和商業思維

AI 季入學特别福利

點擊閲讀原文，加入混沌