大酷樂
  • 汽车
  • 理财
  • 军事
  • 科技
  • 游戏
  • 互联网
  • 娱乐
  • 财经
  • 科学
  • 社会
  • 亲子
  • 电影
  • 健康
  • 教育
  1. 首頁
  2. 科学

马斯克xAI创始成员国内首发声:ChatGPT时代「乱世出英雄」

2023-08-06 简体 HK SG TW

今天小编分享的科学经验:马斯克xAI创始成员国内首发声:ChatGPT时代「乱世出英雄」,欢迎阅读。

马斯克组局xAI" 钻研宇宙本质 ",创始成员高深又神秘。

相比专注于 AI 领網域本身,这些成员大多具有基础学科背景,接触 AI 之前或是在研究基础数学,或是在搞物理。

这家公司究竟要做什么?

就在这两天,丘成桐弟子杨格(Greg Yang),成为第一个以 "xAI 创始成员 " 身份在国内会议上发言的人。

在国际基础科学大会的 " 基础科学与人工智能 " 论坛上,他谈及了自己一直以来、也是接下来要进行的数学 AI 工作,以及对大模型当前发展现状的看法。

而他的个人经历也再次浮出水面,为更多人所关注。

接下来要进行什么研究?

在国际基础科学大会上,杨格就自己正在研究的方向进行了一场演讲。

演讲主题,主要与AI 和数学交叉学科有关——

从数学角度出发,建立一种描述神经网络架构的统一编程语言Tensor Programs。

这是他从微软研究院开始就一直钻研的领網域,继 2019 年连续独立发表的两篇论文之后,迄今这一项目已经有 7 篇相关论文问世。

具体来说,Tensor Programs 项目有一个 " 短期目标 " 和一个 " 长期目标 "。

短期来看,这个编程语言能实现在设计新神经网络架构时,自动进行初始化条件分析,并给出其中最优的超参数初始化条件,从而让模型训练更顺利。毕竟此前,这一领網域的初始化設定几乎 " 全靠经验 "。

长期而言,Tensor Programs 项目的目标是开发大规模深度学习的 " 万物理论 "。

这也与杨格在推特说的、他在 xAI 要进行的研究方向一致:

目前无论是大模型还是其他 AI 研究方向,都依旧没有真正意义上解决 AI" 黑箱 " 的问题,换而言之,AI 究竟走哪种研究方向(堆叠更大参数量的模型、还是 MoE)收益更高,还没有一个明确的结论。

因此,Tensor Programs 最终目标是找到一种理论上的规则,可以真正理解 AI 大模型的行为。

Tensor Programs 最新的项目进展,是微软与 OpenAI 合作发表的论文 µ Transfer,杨格以共同一作的身份完成了这项研究。

这项研究的核心是帮助大模型找到最合适的超参数配置,从而替更多模型节省时间和算力成本,否则对于大模型来说," 重训 " 是一个非常浪费参数的行为。

目前这项研究已经开源,杨格也在这次的演讲中着重以 µ Transfer 为例,介绍了 Tensor Programs 项目的进展。

从这几篇研究论文侧重的 AI 模型来看,大模型如今已经是杨格研究的重点方向之一。

一个值得关注的点就是,μ Transfer 已经用到 GPT-4 中了。

公众号 " 安迪的写作间 " 作者在杨格(Greg Yang)演讲结束后,和他聊了聊:

下台我问了他关于GPT-4 用到 μ Transfer 了吗,给出肯定回答。

所以,他究竟如何看待大模型的未来?

在这次论坛的圆桌对话上,杨格也提到了自己对大模型发展方向的看法。

他认为,继续堆叠大模型参数可以让模型效果越来越好,但这有个前提,即数据集的质量和数量必须要上升。

以前收集网络数据就行,如今训练集必须变得更偏向数学、科学、更有逻辑性,才能提高模型的科学和数学推理能力。

同时,杨格也给了如今拼搏在科研、交叉创新一线的 AI 研究人员一点建议,就是 "Follow your dreams":

这一阶段的很多杰出的搞 AI 的人,像工程师、研究人员,有几个都是像我这样没有读博士,只是就想去干,拼一下就拼出结果的,像 Alec Radford,GPT-1、GPT-2 都是他自己做的,后来 OpenAI 就开始砸钱了。

曹操说的 " 乱世出英雄 ",这是个新世界,你不要想一些外部环境,直接去干,很有可能擦出火花,这就是要你自己有热情。

没错,当年的杨格,打破了微软研究院 " 只招博士生 " 的惯例,本科毕业就进入了这一机构工作。

他在学术经历上究竟有什么过人之处?

换而言之,为何他会成为马斯克选中的 "12 人 " 之一?

杨格是谁?

杨格出生于湖南省,在北京读完小学后,就去了美国,本科考上了哈佛数学系。

在哈佛的头两年,杨格参加了鼓手团、咨询团等众多活动。

大二结束时,有着音乐梦的他决定休学全身心投入音乐事业,成为一名电子舞曲音乐制作人和 DJ,取艺名 "Zeta"。

也是在此期间,杨格接触到了人工智能。

一年半后,杨格发现自己的 " 真爱 " 终归还是数学,于是又回到了哈佛。

读完春季学期的课程后,他又休学两年,这一次他没有执着于音乐,而是快速学习了数学和理论计算机科学,以及人工智能的前沿进展,此外还广泛涉猎物理学、生物学和神经科学。

此外,他还研究起了神经图灵机,并结合可微拓扑学中的思路,提出 "Lie Access Neural Turing Machine",发表于 ICLR。

再次回哈佛,杨格师从丘成桐教授。

△杨格与丘成桐,图源:杨格推特

2017 年,杨格顺利从哈佛毕业,拿到了数学学士学位和计算机科学硕士学位。并获得了 2018 年摩根奖荣誉提名(Honorable Mention for the 2018 Frank and Brennie Morgan Prize for Outstanding Research in Mathematics by an Undergraduate Student)。

毕业后,老师丘成桐曾问杨格 " 你毕业去哪儿 ",他说 " 我要去谷歌 "。

丘成桐说 " 谷歌这种很差的公司就不要去了,我有个朋友叫沈向洋,我马上给他打电话 "。

后来,沈向洋让菲尔兹奖得主 Michael Freedman 面试了杨格:

面试之后(Michael)说这个小孩不得了,那时候他才刚刚本科毕业,但在哈佛至少是前五名(的水平)。

我(沈向洋)当时就跟杨格讲,你把谷歌的 Offer 拿来给我看一看,我给你加一块钱,就来微软吧。

最后杨格选择了微软。而进入微软后杨格也获得了沈向洋的高度评价:

微软研究院平时只招博士生的,杨格作为一个本科毕业生进了微软研究院,不仅进了微软研究院,过去这五年还做得无比优秀,特别是在 GPT 发展过程中做了举足轻重的贡献。

进入微软后,杨格的重要成果之一就是持续开发上面提到的 "Tensor Programs" 框架,其中还用 GPT-3 对所提出的超参数迁移方法进行了验证,相关论文已收录于 NeurIPS、ICML 等顶会:

此外,谷歌学术数据显示,杨格从 2015 开始发布论文,至今已有 34 篇。

其中引用量最高为 415,这也是他在微软的工作,杨格在这个项目中担任主要指导(Primary mentor)。

目前,杨格个人主页和推特主页等均已更新,已离开微软研究院,加入 xAI,接下来将继续做数学工作。

杨格做出了新一轮的选择,但从第一次休学过后,他再也没有放弃对数学的热爱。

在这次的论坛上,杨格也被问到,当时去从事音乐后又转到数学研究,是怎样一直坚定走到现在的?

杨格回答道:

其实就是个人爱好,在我大二休学之前,我一直都是数学比较好的人,可能会觉得一辈子在这种(数学研究中)。之后虽然我去搞音乐,但有段时间自己思考后,发现其实我个人还是很热爱数学。

这里面可能有外在动机(motivation extrinsic)和内在动机(motivation intrinsic)。像数学答卷老师给你 100 分,你觉得很高兴,这是外在的。这种外在和内在混在一起,可能感觉不到自己真心的爱好,但是后来休息一段时间以后,感觉(对数学)是发自内心的热爱,之后就走了这么长的路。

One More Thing

还记得前段时间杨格给大伙儿推荐的 300 多本(大部分是数学)书吗?

不少网友看过之后,表示 " 书单实在太长了,不是普通人能看完的 ",还有网友调侃 " 能不能用 GPT 帮我总结一下 " ……

论坛结束后,我们也和杨格聊了聊,了解了他对 ChatGPT 等大模型的一些看法。

提问:看到您前段时间推荐了大概 300 本多书,有很大一部分是数学书,您认为 AI 是否有可能把它直接总结成一个核心的要点给我们?平时在日常生活中,您是不是也会用 GPT-4 一样的模型,去帮助做一些数学的基础研究什么的?

杨格:我觉得 AI 的总结能力(summarization)现在应该挺好的了,做简单的总结应该没问题。但你要再深入理解它里面的道理,像是一些数学道理的话,可能 AI 现在的帮助还不是那么大。

日常生活的话,是会经常用到(大模型)。

提问:可以透露一下主要是用在哪些方面吗?

杨格:我觉得最有用的方法就是写程式吧。比如有些程式你确实可以自己写,但自己写的话,一是可能要花几个小时,二是觉得这种东西不是特别有趣,所以像这种工作你就可以用 ChatGPT 来帮你做。

提问:相当于您完成核心思考,然后 ChatGPT 帮您实现代码的工作。

杨格:其实就是实现它已经在网上看到很多很多遍、所以它能写得很好的一些程式。

但如果现在你想写一个复杂的程式、像是有什么逻辑性的程式的话,让 ChatGPT 来做可能还不一定做那么好。但如果是那种你写了几百遍的程式了,你不想再写,就可以用 ChatGPT 完成。

参考链接:

[ 1 ] https://arxiv.org/abs/2203.03466

[ 2 ] https://github.com/microsoft/mup

[ 3 ] https://mp.weixin.qq.com/s/s7MGUCHoEfyXhUcQAScltw

熱門排行
  • 王治郅:杨瀚森主要的问题是速度 他 王治郅:杨瀚森主要的问题是速度 他 郟君昊 | 2025-05-05
  • 贸易战烧进电影院:特朗普拟重税打击 贸易战烧进电影院:特朗普拟重税打击 習又夏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天 贷款追高炒黄金的人后悔了!有人一天 寸飛蘭 | 2025-05-05
  • 手机电池突破8000mAh?硅碳技术的回 手机电池突破8000mAh?硅碳技术的回 衛青柏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天 贷款追高炒黄金的人后悔了!有人一天 繁綺文 | 2025-05-05
  • 任天堂对Genki提起Switch 2商标侵 任天堂对Genki提起Switch 2商标侵 郜萌運 | 2025-05-05
  • 哪吒汽车APP和官网恢复正常 知情人 哪吒汽车APP和官网恢复正常 知情人 袁曼雁 | 2025-05-05
  • 极越汽车 CEO 夏一平名下青岛/义乌 极越汽车 CEO 夏一平名下青岛/义乌 集玲琳 | 2025-05-05
  • 全国经济第一大省明确,推动组建农商 全国经济第一大省明确,推动组建农商 佼昌翰 | 2025-05-05
  • 桑保利:亚马尔有配合意识&有点像梅 桑保利:亚马尔有配合意识&有点像梅 甄正浩 | 2025-05-05
  • 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 袁曼雁 | 2023-05-05
  • “懒癌”发病率上升,定期体检别忽视 “懒癌”发病率上升,定期体检别忽视 幸聽楓 | 2023-05-02
  • 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 賁芳蕤 | 2023-05-02
  • 曹操墓,里面都有啥? 曹操墓,里面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他们终于要HE! 十年了,他们终于要HE! 惠惠君 | 2023-05-07
  • 中央部署经济工作,释放5大信号 中央部署经济工作,释放5大信号 郜萌運 | 2023-05-02
  • 高德上线手机弯道会车预警功能 高德上线手机弯道会车预警功能 習又夏 | 2023-05-02
  • 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 賁芳蕤 | 2023-05-02
  • 等比例长大的童星,李兰迪算一个 等比例长大的童星,李兰迪算一个 郟君昊 | 2023-05-02
  • 高端国产车:军车血统,目前电动车越野的“天花板”? 高端国产车:军车血统,目前电动车越野的“天花板”? 謝飛揚 | 2023-05-02
  • 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 集玲琳 | 2023-05-02
  • 《云襄传》终于抬上来啦,男O女A让人好上头! 《云襄传》终于抬上来啦,男O女A让人好上头! 集玲琳 | 2023-05-02
  • 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 衛青柏 | 2023-05-04
  • 普京签署总统令,批准对俄刑法典相关法条的修正案 普京签署总统令,批准对俄刑法典相关法条的修正案 集玲琳 | 2023-05-02
  • 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 袁曼雁 | 2023-05-02
  • 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 寸飛蘭 | 2023-05-05
  • 解除资格!停止一切合作 解除资格!停止一切合作 佼昌翰 | 2023-05-02
  • 中银证券给予南京银行增持评级 中银证券给予南京银行增持评级 袁曼雁 | 2023-05-03
  • 3699起 联想小新mini主机上架 13代酷睿标压处理器 3699起 联想小新mini主机上架 13代酷睿标压处理器 習又夏 | 2023-05-05
  • 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 惠惠君 | 2023-05-02
  • 疯成这样,怎么还能被全网吹捧? 疯成这样,怎么还能被全网吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收购美国第一共和银行 摩根大通收购美国第一共和银行 謝飛揚 | 2023-05-02
  • 台剧赢麻了,又来一部8.9 台剧赢麻了,又来一部8.9 衛青柏 | 2023-05-02
  • 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 郟君昊 | 2023-05-02
  • 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好这件事是关键 "三高"已盯上青少年,做好这件事是关键 習又夏 | 2023-05-05
  • 五一档没一个能打的 五一档没一个能打的 集玲琳 | 2023-05-05
  • 恐怖韩剧下神坛,这次胆小可入 恐怖韩剧下神坛,这次胆小可入 袁曼雁 | 2023-05-05
  • 这剧是不是用ChatGPT写的呀? 这剧是不是用ChatGPT写的呀? 惠惠君 | 2023-05-02
  • 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 袁曼雁 | 2023-05-03
  • 性骚扰惯犯,滚出娱乐圈 性骚扰惯犯,滚出娱乐圈 謝飛揚 | 2023-05-05
  • 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 佼昌翰 | 2023-05-02
  • 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 惠惠君 | 2023-05-02
  • 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 嬴覓晴 | 2023-05-02
  • 当年轻人开始不随份子钱 当年轻人开始不随份子钱 袁曼雁 | 2023-05-02
  • 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 幸聽楓 | 2023-05-03
  • 宋慧乔获视后首次晒照,拿奖杯笑容温柔 宋慧乔获视后首次晒照,拿奖杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們