大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 科學

馬斯克xAI創始成員國内首發聲:ChatGPT時代「亂世出英雄」

2023-08-06 简体 HK SG TW

今天小編分享的科學經驗:馬斯克xAI創始成員國内首發聲:ChatGPT時代「亂世出英雄」,歡迎閱讀。

馬斯克組局xAI" 鑽研宇宙本質 ",創始成員高深又神秘。

相比專注于 AI 領網域本身,這些成員大多具有基礎學科背景,接觸 AI 之前或是在研究基礎數學,或是在搞物理。

這家公司究竟要做什麼?

就在這兩天,丘成桐弟子楊格(Greg Yang),成為第一個以 "xAI 創始成員 " 身份在國内會議上發言的人。

在國際基礎科學大會的 " 基礎科學與人工智能 " 論壇上,他談及了自己一直以來、也是接下來要進行的數學 AI 工作,以及對大模型當前發展現狀的看法。

而他的個人經歷也再次浮出水面,為更多人所關注。

接下來要進行什麼研究?

在國際基礎科學大會上,楊格就自己正在研究的方向進行了一場演講。

演講主題,主要與AI 和數學交叉學科有關——

從數學角度出發,建立一種描述神經網絡架構的統一編程語言Tensor Programs。

這是他從微軟研究院開始就一直鑽研的領網域,繼 2019 年連續獨立發表的兩篇論文之後,迄今這一項目已經有 7 篇相關論文問世。

具體來說,Tensor Programs 項目有一個 " 短期目标 " 和一個 " 長期目标 "。

短期來看,這個編程語言能實現在設計新神經網絡架構時,自動進行初始化條件分析,并給出其中最優的超參數初始化條件,從而讓模型訓練更順利。畢竟此前,這一領網域的初始化設定幾乎 " 全靠經驗 "。

長期而言,Tensor Programs 項目的目标是開發大規模深度學習的 " 萬物理論 "。

這也與楊格在推特說的、他在 xAI 要進行的研究方向一致:

目前無論是大模型還是其他 AI 研究方向,都依舊沒有真正意義上解決 AI" 黑箱 " 的問題,換而言之,AI 究竟走哪種研究方向(堆疊更大參數量的模型、還是 MoE)收益更高,還沒有一個明确的結論。

因此,Tensor Programs 最終目标是找到一種理論上的規則,可以真正理解 AI 大模型的行為。

Tensor Programs 最新的項目進展,是微軟與 OpenAI 合作發表的論文 µ Transfer,楊格以共同一作的身份完成了這項研究。

這項研究的核心是幫助大模型找到最合适的超參數配置,從而替更多模型節省時間和算力成本,否則對于大模型來說," 重訓 " 是一個非常浪費參數的行為。

目前這項研究已經開源,楊格也在這次的演講中着重以 µ Transfer 為例,介紹了 Tensor Programs 項目的進展。

從這幾篇研究論文側重的 AI 模型來看,大模型如今已經是楊格研究的重點方向之一。

一個值得關注的點就是,μ Transfer 已經用到 GPT-4 中了。

公眾号 " 安迪的寫作間 " 作者在楊格(Greg Yang)演講結束後,和他聊了聊:

下台我問了他關于GPT-4 用到 μ Transfer 了嗎,給出肯定回答。

所以,他究竟如何看待大模型的未來?

在這次論壇的圓桌對話上,楊格也提到了自己對大模型發展方向的看法。

他認為,繼續堆疊大模型參數可以讓模型效果越來越好,但這有個前提,即數據集的質量和數量必須要上升。

以前收集網絡數據就行,如今訓練集必須變得更偏向數學、科學、更有邏輯性,才能提高模型的科學和數學推理能力。

同時,楊格也給了如今拼搏在科研、交叉創新一線的 AI 研究人員一點建議,就是 "Follow your dreams":

這一階段的很多傑出的搞 AI 的人,像工程師、研究人員,有幾個都是像我這樣沒有讀博士,只是就想去幹,拼一下就拼出結果的,像 Alec Radford,GPT-1、GPT-2 都是他自己做的,後來 OpenAI 就開始砸錢了。

曹操說的 " 亂世出英雄 ",這是個新世界,你不要想一些外部環境,直接去幹,很有可能擦出火花,這就是要你自己有熱情。

沒錯,當年的楊格,打破了微軟研究院 " 只招博士生 " 的慣例,本科畢業就進入了這一機構工作。

他在學術經歷上究竟有什麼過人之處?

換而言之,為何他會成為馬斯克選中的 "12 人 " 之一?

楊格是誰?

楊格出生于湖南省,在北京讀完小學後,就去了美國,本科考上了哈佛數學系。

在哈佛的頭兩年,楊格參加了鼓手團、咨詢團等眾多活動。

大二結束時,有着音樂夢的他決定休學全身心投入音樂事業,成為一名電子舞曲音樂制作人和 DJ,取藝名 "Zeta"。

也是在此期間,楊格接觸到了人工智能。

一年半後,楊格發現自己的 " 真愛 " 終歸還是數學,于是又回到了哈佛。

讀完春季學期的課程後,他又休學兩年,這一次他沒有執着于音樂,而是快速學習了數學和理論計算機科學,以及人工智能的前沿進展,此外還廣泛涉獵物理學、生物學和神經科學。

此外,他還研究起了神經圖靈機,并結合可微拓撲學中的思路,提出 "Lie Access Neural Turing Machine",發表于 ICLR。

再次回哈佛,楊格師從丘成桐教授。

△楊格與丘成桐,圖源:楊格推特

2017 年,楊格順利從哈佛畢業,拿到了數學學士學位和計算機科學碩士學位。并獲得了 2018 年摩根獎榮譽提名(Honorable Mention for the 2018 Frank and Brennie Morgan Prize for Outstanding Research in Mathematics by an Undergraduate Student)。

畢業後,老師丘成桐曾問楊格 " 你畢業去哪兒 ",他說 " 我要去谷歌 "。

丘成桐說 " 谷歌這種很差的公司就不要去了,我有個朋友叫沈向洋,我馬上給他打電話 "。

後來,沈向洋讓菲爾茲獎得主 Michael Freedman 面試了楊格:

面試之後(Michael)說這個小孩不得了,那時候他才剛剛本科畢業,但在哈佛至少是前五名(的水平)。

我(沈向洋)當時就跟楊格講,你把谷歌的 Offer 拿來給我看一看,我給你加一塊錢,就來微軟吧。

最後楊格選擇了微軟。而進入微軟後楊格也獲得了沈向洋的高度評價:

微軟研究院平時只招博士生的,楊格作為一個本科畢業生進了微軟研究院,不僅進了微軟研究院,過去這五年還做得無比優秀,特别是在 GPT 發展過程中做了舉足輕重的貢獻。

進入微軟後,楊格的重要成果之一就是持續開發上面提到的 "Tensor Programs" 框架,其中還用 GPT-3 對所提出的超參數遷移方法進行了驗證,相關論文已收錄于 NeurIPS、ICML 等頂會:

此外,谷歌學術數據顯示,楊格從 2015 開始發布論文,至今已有 34 篇。

其中引用量最高為 415,這也是他在微軟的工作,楊格在這個項目中擔任主要指導(Primary mentor)。

目前,楊格個人主頁和推特主頁等均已更新,已離開微軟研究院,加入 xAI,接下來将繼續做數學工作。

楊格做出了新一輪的選擇,但從第一次休學過後,他再也沒有放棄對數學的熱愛。

在這次的論壇上,楊格也被問到,當時去從事音樂後又轉到數學研究,是怎樣一直堅定走到現在的?

楊格回答道:

其實就是個人愛好,在我大二休學之前,我一直都是數學比較好的人,可能會覺得一輩子在這種(數學研究中)。之後雖然我去搞音樂,但有段時間自己思考後,發現其實我個人還是很熱愛數學。

這裡面可能有外在動機(motivation extrinsic)和内在動機(motivation intrinsic)。像數學答卷老師給你 100 分,你覺得很高興,這是外在的。這種外在和内在混在一起,可能感覺不到自己真心的愛好,但是後來休息一段時間以後,感覺(對數學)是發自内心的熱愛,之後就走了這麼長的路。

One More Thing

還記得前段時間楊格給大夥兒推薦的 300 多本(大部分是數學)書嗎?

不少網友看過之後,表示 " 書單實在太長了,不是普通人能看完的 ",還有網友調侃 " 能不能用 GPT 幫我總結一下 " ……

論壇結束後,我們也和楊格聊了聊,了解了他對 ChatGPT 等大模型的一些看法。

提問:看到您前段時間推薦了大概 300 本多書,有很大一部分是數學書,您認為 AI 是否有可能把它直接總結成一個核心的要點給我們?平時在日常生活中,您是不是也會用 GPT-4 一樣的模型,去幫助做一些數學的基礎研究什麼的?

楊格:我覺得 AI 的總結能力(summarization)現在應該挺好的了,做簡單的總結應該沒問題。但你要再深入理解它裡面的道理,像是一些數學道理的話,可能 AI 現在的幫助還不是那麼大。

日常生活的話,是會經常用到(大模型)。

提問:可以透露一下主要是用在哪些方面嗎?

楊格:我覺得最有用的方法就是寫程式吧。比如有些程式你确實可以自己寫,但自己寫的話,一是可能要花幾個小時,二是覺得這種東西不是特别有趣,所以像這種工作你就可以用 ChatGPT 來幫你做。

提問:相當于您完成核心思考,然後 ChatGPT 幫您實現代碼的工作。

楊格:其實就是實現它已經在網上看到很多很多遍、所以它能寫得很好的一些程式。

但如果現在你想寫一個復雜的程式、像是有什麼邏輯性的程式的話,讓 ChatGPT 來做可能還不一定做那麼好。但如果是那種你寫了幾百遍的程式了,你不想再寫,就可以用 ChatGPT 完成。

參考鏈接:

[ 1 ] https://arxiv.org/abs/2203.03466

[ 2 ] https://github.com/microsoft/mup

[ 3 ] https://mp.weixin.qq.com/s/s7MGUCHoEfyXhUcQAScltw

熱門排行
  • 王治郅:楊瀚森主要的問題是速度 他的速度跟不上現代籃球的節奏 王治郅:楊瀚森主要的問題是速度 他的速度跟 郟君昊 | 2025-05-05
  • 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 逼好萊塢等回美拍片 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 習又夏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 寸飛蘭 | 2025-05-05
  • 手機電池突破8000mAh?矽碳技術的回旋镖:「折壽」換容量 手機電池突破8000mAh?矽碳技術的回旋镖:「折 衛青柏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 繁綺文 | 2025-05-05
  • 任天堂對Genki提起Switch 2商标侵權訴訟,後者回應稱将嚴肅對待 任天堂對Genki提起Switch 2商标侵權訴訟,後 郜萌運 | 2025-05-05
  • 哪吒汽車APP和官網恢復正常 知情人士:之前斷網因流量欠費 哪吒汽車APP和官網恢復正常 知情人士:之前斷 袁曼雁 | 2025-05-05
  • 極越汽車 CEO 夏一平名下青島/義烏兩家公司被列入經營異常 極越汽車 CEO 夏一平名下青島/義烏兩家公司 集玲琳 | 2025-05-05
  • 全國經濟第一大省明确,推動組建農商聯合銀行 全國經濟第一大省明确,推動組建農商聯合銀行 佼昌翰 | 2025-05-05
  • 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩更專注進球&更像C羅 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 曹操墓,裡面都有啥? 曹操墓,裡面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 200戶連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200戶連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們