今天小編分享的互聯網經驗:OpenAI大神Karpathy最新分享:為什麼OpenAI内部對AI Agents最感興趣,歡迎閲讀。
Andrej Karpathy 這位 OpenAI 聯合創始人最近在一個開發者活動上發表簡短講話,談論了自己和 OpenAI 内部對 AI Agents (人工智能代理人)的看法。
Andrej Karpathy 對比了過去開發 AI Agent 的困難和現在新技術工具下開發的新機會,他還不忘調侃自己在特斯拉的工作,是 " 被自動駕駛分了心 ",他認為自動駕駛和 VR 都是糟糕的 AI Agents 的例子。
對于新的機會,Andrej Karpathy 認為此刻正是再次回歸神經科學,從中尋求靈感的時刻——正像在深度學習早期發生的那樣。
另一方面,Andrej Karpathy 認為普通人、創業者和極客在構建 AI Agents 方面相比 OpenAI 這樣的公司更有優勢,大家目前處于平等競争的狀态,因此他很期待看到這方面的成果。
他還透露,如果一篇論文提出了某種不同的訓練方法,OpenAI 内部的 Slack 上會嗤之以鼻,認為都是他們玩剩下的。但是當新的 AI Agents 論文出來的時候,他們會認真興奮的讨論。
以下是此次分享全文:
大家好。
我受邀就 AI Agents 的話題説一些激勵的話。我認為 AI Agents 在某種程度上跟我是很近的關系,讓我以一個故事開始,這是一個非常早期的 OpenAI 的故事,那時 OpenAI 可能只有十幾個人,在 2016 年左右,當時的潮流實際上是 RL Agents(強化學習代理人)。
每個人都對建立代理人非常感興趣,但在當時主要是基于遊戲,人們的興奮點圍繞着像 Atari 這樣的遊戲公司,而我當時在 OpenAI 的項目試圖将 RL Agents 的重點放在用鍵盤和滑鼠使用電腦上,而不是遊戲。
我想讓它們變得更有用,可以做很多工作,這個項目被稱之為 World of Bits。
我和幾位同事最後發表了一篇論文。這不是一篇非常驚豔的論文,因為實際上這是基于 RL 強化學習方法的。我們的網頁非常簡單,上面可以讓人比如預定一個班機或者訂購一些食物等等。
這一切顯然是行不通的,因為技術還沒有準備好,在那時做這些東西是不明智的。
事實證明,應該完全忘記 AI Agents 這件事,去做語言模型。
五年之後我們回到這裏,期間我被自動駕駛分了一點心,但現在 AI Agents 重新酷了起來,而我們的工具箱完全不一樣了,我們處理這些問題的方式也完全不同了。
事實上,你們所有人都在研究 AI Agents,但你們可能沒有使用任何強化學習方法。這太瘋狂了,我不認為我們當時會預見到這一點。這簡直太有趣了。
下面我花一點時間談談為什麼 AI Agents 如此火爆。我想很明顯,對很多人來説,AGI(通用人工智能)将充分利用 AI Agents 的能力,不是一個,而是很多個。也許将會出現數字實體的組織或文明,我認為這是非常鼓舞人心的,甚至有點瘋狂。
不過,我也想為此潑點冷水。 我認為有一大類問題很容易想象,很容易構建、演示,但實際上很難制作稱為產品。很多事情都屬于這一類,比如我想自動駕駛就是一個例子。
自動駕駛很容易想象,也很容易構建汽車繞街區行駛的演示,但将其變成產品需要十年時間。同樣的道理,我覺得 VR 也是如此,讓它發揮作用需要十年時間。
我認為 AI Agents 某種程度上也是如此。很容易想象它的場景,非常激發人的興奮感,但我認為如果你參與其中,你應該投入十年時間來讓它真正發揮作用。
我想説的另一件事是,我認為現在回到神經科學并在某些方面再次從中獲得靈感是很有趣的,深度學習的早期階段就受到了神經科學的啓發。
思考它們之間的關系是非常有趣的,特别是我認為很多人都把語言模型當作解決方案的一部分,但如何構建一個完整的,擁有人類所有認知能力的數字實體呢?
顯然,我們都認為我們需要某種潛在的系統來規劃、思考和反思我們正在做的事情,這是神經科學發揮作用的地方。
比如,海馬體是非常重要的,AI Agents 中什麼東西發揮着海馬體的作用,用來實現儲存記憶,标記檢索等等這些功能?
我們大致已經了解如何構建視覺和聽覺皮層,但還有許多的東西我們并不知道在 AI Agents 中意味着什麼。
比如視覺遊戲在 AI Agents 中是什麼樣子的?潛意識的所在地——丘腦在 AI Agents 中又相當于什麼呢?
這非常有趣。事實上我今天帶了一本神經科學的書,David Eagleman 的《大腦與行為》,我發現這本書非常有趣和有啓發性。
從神經科學中汲取一些有趣的靈感,就像早期我們設計單個神經元時所做的那樣,今天我們也許應該再次這樣做。
最後我想用一些鼓勵的話結尾。一個有趣但不明顯的事情是,你們(指現場觀眾)構建的 AI Agents 實際上處于當代 AI Agents 能力的最前沿,所有的大型 LLM 機構比如 OpenAI、DeFi 等,我懷疑他們都沒有處于最前沿。
你們正處于最前沿。
舉個例子,OpenAI 非常擅長訓練 Transformer 大語言模型。如果一篇論文提出了某種不同的訓練方法,那麼我們 OpenAI 内部的 Slack 群組裏的讨論會類似于,哦是的,有人在兩年半嘗試過,它不起作用,我們對這種方法的來龍去脈非常了解。
但是當新的 AI Agents 論文出來的時候,我們都非常感興趣,覺得它非常酷,因為我們的團隊并沒有花費五年時間在這上面,我們并不比你們更多掌握什麼,我們正在與你們所有人一起競争。
這就是我為什麼認為你們處于 AI Agents 能力的最前沿的原因,這對 AI Agents 的發展來説是非常重要的。