今天小编分享的教育经验:对谈张亚勤:我预演中的AGI地图,欢迎阅读。
以下文章来源于腾讯科技 ,作者张小珺
作者| 张小珺
来源 |腾讯科技 管理智慧
咨询合作| 13699120588
文章仅代表作者本人观点
"未来会有新的物种,它将是人类的延伸,然而终究是一个全新物种。"
人人都谈论AGI,但未来AGI到底是一幅什么样的画面?
针对这个话题,我们在2024年底访谈了清华大学智能产业研究院(AIR)院长、前百度公司总裁张亚勤院士。
在他的腦海中,人工智能会按照"信息智能>物理智能>生物智能"的图谱逐步逼近和实现AGI。这种构想和信仰之下,AGI呈现的是一个乐观的前景画面。
在他看来,信息智能的AGI5年内可达到;物理智能的AGI分阶段达成,如人形机器人大约需要10年达到;而最终的生物智能需要花费15年到20年。
到那时,人类大腦不仅能得到全方位的拓展,人类还能大幅度延长寿命,甚至"未来会有一个新的物种"。
"回顾3万年前的人类,你会觉得那和现在的人类是同一物种吗?"张亚勤说,"3万年前的山顶洞人,属于猿人阶段,那时人类虽已开始使用工具,石器时代也有了火,但工具极为原始。如今,我们拥有手机、电腦与互联网。倘若再过100年,后人看我们现今的手机、互联网以及个人电腦,或许就如同我们看待3万年前的火与石器一般。而且,这种进化的速度正变得愈发迅速。"
故而他认为,"或许只需30年,至多100年,到那时,新的物种会比现在的人类聪慧得多。但它依旧由人类掌控,受我们的意识支配"。
以下是对张亚勤院士的访谈。
信息智能:是大腦的智商
张小珺:你之前提过未来20年在实现AGI的路上,会逐步实现信息智能、物理智能和生物智能,能不能推演一下你腦海中AGI路线图?
张亚勤:我一直认为,新一代人工智能是信息智能+物理智能+生物智能。
信息智能很简单,就是ChatGPT,所有文字、影像、视频,是信息世界的智能。
物理智能是把它用到无人车、机器人、现在讲的具身智能,用到基础物理设施去。
生物智能是把人工智能用到比如腦机接口。像ElonMusk的Neuralink,连到生物体、生命体,包括医疗、手术机器人和新药研发。这些领網域当然相互有联系,但它是不同领網域。
我认为5年内,我们在信息智能方面,可以通过图灵测试,达到AGI水平。ChatGPT出来,在文字方面基本达到,后面要加推理、多模态。Sora,希望很快出来。再过一段时间,在自然语言和自然内容上,我们生成的图片、视频,5年内,在信息智能方面达到人类的水平。
张小珺:我们先来讲讲信息智能,信息智能可以改写整个现在的商业生态吗?
张亚勤:人工智能本身并没有改变商业实质,你该做什么,还是做什么。它就是把生产力大幅度提高,会催生出一些新的商业模式,但商业本质并没有改变。
现在,用AI写邮件、写文章更方便,编程效率更高,解数学公式也能靠它。在这些方面,AI会超越普通人,甚至超过数学家、物理学家,其智能水平相当于人类,甚至更高。
人工智能更多体现的是智力。想象一下,有个人腦袋特别聪明,能做很多事。能解题、发明新公式、写出好文章,还能画画、作诗——所以说人工智能就像是我们大腦的智商体现。
以游泳为例,就算你读再多的书,不实际去学,还是不会游泳,必须要在水里练习才能学会。这个就是物理世界的特性,得在实际的物理环境中实践。好比你爱喝酒,不管你多聪明,读多少书,不亲自品尝还是不知道酒的滋味。
信息世界里,人工智能可以做到像一个博古通今、智商极高的人,这在5年内就能实现。
物理智能再需要点时间,物理智能比较高的等级是我们讲的人形机器人,可能还需要10年。10年是不是完全比人厉害?肯定在大部分任务上会超越人类。
物理智能:与其叫机器人,
不如叫"机器anything"
张小珺:物理智能第一个落地的是自动驾驶。
张亚勤:是。无人驾驶是一个相对来讲可控的领網域。
机器人领網域属于开放性问题,而自动驾驶则是封闭性问题。就自动驾驶而言,它只专注于开车这一件事,并且能把这件事做得特别出色。但机器人不一样,它需要具备常识,要理解人类的行为,还要应对诸多复杂的环境。
可以这样讲,无人驾驶其实是一个会开车的机器人,属于垂直领網域的机器人,也是应用于特殊场景的机器人。
举个例子,开车技术好的司机,不需要会写诗,不需要有超高的智商,也不需要会唱歌或者懂生物知识,只要把开车这件事做好就行。这就跟工厂里负责焊接的工人一样,专注做好手头这一件事。然而,人形机器人面临的要求就要多得多。
在机器人的应用方面,我将它抽成三种大场景:一种是家庭机器人,一种是工业机器人,一种是社会机器人。
家庭机器人的概念很容易理解,它主要在家中照顾老人、帮忙做家务,还能陪人聊天。不过,家庭机器人的研发肯定是难度最大的。
社会机器人应用的场景,像警察、保安执行任务,送外卖,还有开车等,都属于社会行为的范畴。未来,警察队伍可能依然需要一些人类警察,但大部分警务工作由机器人来做就很不错。机器人保安或许会比人类保安更出色,当然,它得听从人类的安排,充当人类的助理角色。或许过不了多少年,开车的人就会越来越少,无人驾驶将成为主流。
张小珺:无人驾驶也是社会机器人?
张亚勤:对,那些在街上穿梭、能与大众频繁互动的机器人,属于社会形态的机器人。
除此之外,还有工业机器人。像在危险环境中,比如矿山里,或是在工厂内部从事精细作业的机器人,都属于这一类。相对而言,工业机器人的目标较为明确,且是在特定场景下执行任务。
但我们希望后台的技术是通用的。即便在前端,比如在具身智能方面,或是在边缘计算环节,表现形式可能有所不同,但底层技术最好能通用。
张小珺:你说的是家庭、工业、社会都是通用的?
张亚勤:对。一个通用的后台大模型。我希望它70%-80%的后台技术都实现通用。
张小珺:这个巨大的模型会是今天像OpenAI这样的模型?
张亚勤:是。这些模型必须要多模态,要从物理世界学习东西,然后大模型再把它变成智能。
最后做的时候还是每个地方不一样。但这个后台基本是统一的后台,所以是通用平台。
张小珺:今天大模型和自动驾驶还是两套架构,现在是没有办法融合在一起的,但未来是肯定会融合的。
张亚勤:对,我们现在后台都是大模型。在此基础上,又针对自动驾驶构建了一个垂直模型,这些都部署在云端。而在车上,还配备了一个小型的边缘模型。我将其归纳为三个层级。
就像作業系統一样,作業系統是一个云端作業系統,上面搭载着SuperApps,当部署到手机端时,又有相应的应用程式。今后,不管你把它们称作App还是Agent,本质都是为了完成特定的任务,只是这些任务在不同领網域会有所差异。
举例来说,工业机器人完全没必要做成拟人形态,只要能把相应的工作完成就可以。但家庭机器人的话,拟人形态可能是最佳选择。不过,家庭服务机器人也并非一定要是人形,可能会是类似狗或猫的形态。就像盲人出行,以后或许有机器狗就能引导其行走。
所以说,与其局限于"机器人"这个称呼,不如把这类机器统称为"机器万物(机器anything)"。
张小珺:为什么家庭机器人最好是人形?
张亚勤:人形机器人和非人形机器存在着明显区别。以家庭场景为例,家中老人在与人形机器人进行沟通时,会比与电腦或其他非人形机器的交流更为自然顺畅。
随着技术发展,未来人形机器人的外形会与人类高度相似,甚至达到以假乱真的程度,进一步提升人机互動的自然度。你可以跟它谈心,把它当作伴侣,还能让它帮你处理各种事物。它就变成像你的管家一样。
另外,为什么要有人形机器人?这是因为当下的社会环境,包括各类基础设施,都是依据人类的特点和需求来设计建造的。像爬楼梯、按按钮这类操作,对于人形机器人来说相对容易实现,因为这些设施本就是按照人类的使用方式来设计的。但这更多的是一种选择吧。
再看社会机器人,就拿警察机器人举例,如果它的体型过小,会让人觉得缺乏威严;若体型过大,又会给人带来压迫感,让人感到不舒服。而设计成人形的话,就会给人一种仿佛是人与人在交流的感觉,更符合人们的心理预期。
张小珺:避免"恐怖谷效应"。
张亚勤:对。这更多是一种社会进化,你看到的是你的同类。
我一直讲,或许10年之内,机器人的数量就会超过人类,而且每个人可能自己都有一个你的copy,你的机器人。像你的替身一样。这个机器人能帮你处理很多事,简直就像是你的分身。希望以后每个人配备一个分身,毕竟分身太多可能会引发一系列问题。
这个分身从属于你,对你唯命是从,扮演着助理的角色。这个助理十分聪明,甚至比你都厉害,但它始终会听从你的指令。
张小珺:它属于家庭、工业,还是社会?
张亚勤:都可以。你如果在家里就是家庭机器人。你如果到工厂上班,工厂里面可能有你的机器人,帮你做事。这两个场景不一定要是同一个机器人,但它必须要适应不同的场景。
张小珺:社会机器人和家庭机器人,哪个更难达到?
张亚勤:看情况。所有人形机器人都不容易,需要很长时间。所以我觉得,大概5年或者10年,慢慢地就能看到人形机器人的一些初步样子了。
在机器人这块儿,无人驾驶机器人算是我们已经有成果的领網域。
我刚从旧金山回来,坐了Waymo的无人驾驶车,体验特别棒,它开起来比人开得还平稳顺滑。关键是,现在旧金山的市民都乐意坐这种车,已经不觉得这是什么新鲜玩意儿了,甚至把它当成出行的首选。
张小珺:今年萝卜快跑在武汉,公众还不太能接受这件事。
张亚勤:对,现在萝卜快跑安全性比有人驾驶要高至少10倍,同时开得也很好。虽然落地时间比较短,但乘客评价却很高。目前来看,大众还是认为它是一个新兴技术。
对比中美,阿波罗和Waymo是属于走在最前的,你看到了就会说这是未来的无人驾驶。但无人驾驶可能放到现在车里,也可以作为出租车的一种服务,这是商业模式问题,因为技术能力已经实现了。
张小珺:你怎么看马斯克代表的L2+路线和Waymo代表的L4路线,马斯克也认为他的L2+能够上升到L4。
张亚勤:可以上升到,但现在仍处于发展阶段,还需要进行大量测试,并且要依靠新技术的支持。就目前而言,它还存在一些局限性。
当下的FSD(完全自动驾驶)系统还没办法实现真正意义上的Robotaxi功能,因为FSD设计的是有人参与的驾驶模式,在行驶过程中,人依然可以接管车辆操控。而真正的Robotaxi是完全不需要人接管的,甚至未来连方向盘都不会配备。这对技术的要求相当高。
不过,值得一提的是,这个看似很高的技术要求其实已经有人实现了。要是特斯拉着手去做这方面的业务,以它的规模,影响力会更大。而且以后,其他汽车企业也都有能力做到这一点。
张小珺:车企以后都可以做到?
张亚勤:都能。Waymo和百度在中国和美国证明无人驾驶技术是可行的,这个我觉得很重要。这个时候大家就是看谁跑得快点,跑得慢点,商业模式怎么落地。
看到曙光了。
两年之前我觉得还看不到。像我是一直有信心的,但你问我什么时候发生,我也不知道,现在很清楚了。
张小珺:如果车企能做的话,他们自己本身就有车队,对比Waymo或者百度阿波罗这样的产品,商业模式会不一样吗?最后这个赛道属于谁?
张亚勤:大致想来,存在三种类型的企业:
一种企业是提供服务的企业,例如当下的滴滴,以及传统的出租车运营公司,它们都致力于提供运营服务。
一种是做整车制造的企业。
还有一类企业专注于生产车内相关产品,比如芯片,像地平线、英伟达这类公司便属此类。有些公司可能选择只专注于汽车制造,不涉足Robotaxi服务;而有些公司则仅开展服务业务,使用其他公司生产的车辆。这种情况在行业中都会出现。
就像特斯拉宣称自己什么业务都做,这当然也可行。如此一来,企业之间便会形成一定的竞争态势。但最终谁能脱颖而出,还需拭目以待。而且,最终胜出的不会只有一家,而是会有多家企业在市场中占据一席之地。
张小珺:李想(理想汽车CEO)和何小鹏(小鹏汽车CEO)都说他们做L4的技术,但不会做Robotaxi的平台方。
张亚勤:可能很多车厂不做这个事。就像现在一样,不做出租车生意,只是销售汽车而已。这种情形在未来依旧会存在。总之,整个产业包含三个关键部分:其一是服务,其二是车辆,其三则是车内的芯片、元件等部件。
张小珺:为什么自动驾驶、具身智能在今年这么火?
张亚勤:如今大家都看到行业发展的曙光了。其中,大模型成为了一个关键的促进因素,可以说是引发变革的导火索。我先讲无人驾驶,再讲具身智能。
多年来,无人驾驶一直面临着几个主要难题:第一个问题是数据量匮乏,要大量的测试数据;其次,存在诸多极端情况(cornercase),在实际驾驶过程中,许多场景下的安全问题并不容易遇到,然而在测试时,却又会遭遇各种新问题,这反映出无人驾驶技术的泛化能力较差;最后,人工智能技术方面,各类模型较为分散,例如地图构建是一个模型,视觉识别是一个模型,语言处理又是另一个模型,呈现出碎片化的状态。
这些碎片化的模型,要将它们整合在一起,既要进行感知,又要完成融合,还要做规划以及决策,只能逐个部分去处理。而且其中包含大量规则,有人工智能算法、神经元算法,还有许多固定规则,拼凑得杂乱无章。
大模型出来之后,不能讲完全解决,但能加速解决这些问题。
针对数据不足的问题,生成式AI能够依据真实数据生成大量数据,这使得整个模拟、仿真的速度大幅提升。
关于场景不足的难题,大模型自身具备出色的泛化能力,也就是所谓的常识。大模型不仅拥有常识,还能通过模拟器学习这些常识。因此,即便遇到许多未曾接触过的情况,它也能较为轻松地解决问题。
大模型推动了端到端解决方案的探索。将所有这些模型整合起来,只需一个输入,就能得到一个输出,最多利用一些规则来保障安全。
所以,这三个大的挑战不能讲完全解决,但至少得到了很大程度的缓解,大幅度加速了无人驾驶的这种开发的进程。
张小珺:马斯克提出的端到端模型是一个让大家看到曙光的重要产品。
张亚勤:端到端的方案大家都在研究推进,而且很快就能投入应用,我们现在也已经开始采用。
大模型的出现,极大地加速了相关技术的发展,彻底改变了整个行业生态。以前,我们虽然也有类似的想法,但缺乏足够的认知与技术支持。如今大模型问世,让我们有了实现这些想法的可能。
现在大家都采用Transformer架构。过去可不是这样,一会儿用卷积编码(ConvolutionalCode),一会儿又用循环神经网络(RNN),算法繁杂多样。这其实就是上一代人工智能,深度学习第一代和第二代的区别所在。那时针对不同的输入,要采用不同的算法,产生不同的输出后,再进行融合处理。但现在,无论输入是什么,都用同样的Transformer来处理,也就是基于Token进行处理。
无人驾驶领網域如此,具身智能领網域同样如此。
就拿机器人来说,机器人面临的问题,基本上和无人驾驶类似。只不过机器人领網域的数据更为稀少。而且,在过去,机器人在数字空间进行模拟时,通常采用强化学习的方式,设定一个环境和智能体,让智能体通过学习找到一种策略,然后应用到实体机器人上。然而,实际应用中却常常发现这种策略并不奏效。
现在,AIR(清华大学智能产业研究院)正在研发RSR技术,这项技术将真实世界与物理世界紧密连接起来,从而加快了机器人技术的发展。也就是说,在模拟世界、数字空间里进行学习所获得的成果,能够更好地应用到实际中,让机器人技术更快落地。
张小珺:这个叫世界模型?
张亚勤:你可以讲构建了个世界模型。我把它叫RSR,就是RealtoSimtoReal。
这里的"Real"指的是真实世界中的事物。我们从真实场景出发,通过分析将其转化为数字世界的内容,这就是"从真实到模拟(RtoSim)",也就是模拟(simulation)过程。在模拟阶段,我们能够运用各种AI生成工具,比如StableDiffusion这类当下新型的生成式AI工具,生成大量内容。借助这些工具,我们把数字世界与真实世界紧密相连。
如此一来,在数字空间里学到的东西便能立刻应用到实际中,这就如同无人驾驶领網域那样,有效地弥补了数据不足的问题。
张小珺:它像是积累了一堆的常识,然后再灌给它。
张亚勤:第三点至关重要,即拥有一个大型模型。在过去,机器人面临的最大难题是无法理解人类意图。它或许能识别听到的字词,却不明白背后的含义,缺乏基本常识。
机器人既没有理解力,也不太具备推理能力。然而,大型模型出现后,情况就大为不同了。这就好比大模型充当了一个"大腦",可以对前端的机器人进行指挥。这是一个巨大的飞跃,归功于大模型所具备的常识。
举个例子,对于家庭机器人,我下达指令:"你帮我把脏衣服拿下来,送到干洗店洗好后再拿回来。"放在过去,机器人完成这样的任务难度极大。但现在相对轻松很多,因为像ChatGPT或者GPT这类模型,在接收到指令后,能够理解其含义,并将指令分解为具体动作,进而指挥机器人去执行。
张小珺:加了个"腦子"。
张亚勤:现在机器人就好比多了个"腦子",而这个"腦子",在过去可是机器人最难具备的东西。过去,每一项任务对机器人来说,都是巨大的挑战。但现在不一样了,我们实现了很自然的人机对话,大模型能理解我说的话,然后把任务分解,指挥机器人去执行。
机器人的应用场景特别繁杂。就好比做早饭的机器人和扫地机器人,它们的任务完全不同,不能一概而论。但我们希望机器人的"大腦",也就是后台系统是通用的,只是前端执行部分有所差异。
过去的做法是,扫地机器人是一套独立的系统,和做饭机器人毫无关联。洗衣服、焊接元件、质量检测、开车等不同功能的机器人,各自都是专用的,相互之间没有联系。但现在,后台本质上是一样的,只是前端根据不同任务有所区别。
这就好比人,一个人具备多种能力。人通过学习拥有基本常识和智能后,既能学开车,也能学扫地。
无论做什么,还是同一个人,不需要每次换个"腦子"。
张小珺:今天开车这个场景是相对确定的,其他工作还不好说。
张亚勤:打个比方,以前我常开玩笑说,机器人会开车却不会开门,就算能开门,又开不了微波炉,即便打开了,还不知道怎么关上。诸如此类的小细节问题,要是每个都专门設定一种新算法,那可太麻烦了。
早期,人们尝试用各种规则来解决这些问题,但现在不同了。现在有了大模型,机器人一看就学会了。学会之后,不管遇到什么东西,它都知道怎么开,也知道该用多大劲。比如说它给你端茶,知道茶是热的,还会提醒你小心。类似这样的事它都能做到,这就是所谓的具备了常识。
那常识从哪儿来呢?就是从大模型中来的。不需要在每个细节上都教它,过去那种一个规则接一个规则地设定,得定多少规则啊!现在不用这么麻烦,机器人学会之后就能举一反三,就跟人一样,学会了就会自己推理。
比如说,你告诉它你饿了,想吃点东西。要是它知道你爱吃香蕉,就可能在房间里找到香蕉拿给你。要是订餐,知道你不吃羊肉,点餐的时候就不会给你点羊肉。它会具备这些常识,不需要把每个细节都记下来。它就像人一样,能理解你,知道这些最基本的生活常识。
张小珺:今天落地自动驾驶和后面的具身智能分别的难点是什么?
张亚勤:为什么我觉得信息世界相对简单些呢,因为在信息世界里,你只要有一部手机或者一台电腦就基本能开展相关活动了。然而,信息世界在部署场景方面,自身的周期会比较漫长,而且难点众多。
以无人车为例,要让无人车能在路上正常行驶,首先就会面临政策法规方面的问题,同时还得解决如何与有人驾驶车辆在道路上相互协调的问题。所以,在这样的物理场景中,要打造一个完整的世界模型。但如果是做虚拟世界,就不需要考虑这些,只需要构建一个物理模型就行,可这也并非易事。
机器人的情况也是如此。比如说,要是用轮足式机器人送外卖,那它该如何上下楼?又要怎么开门?这些具体场景对技术的要求更为复杂。
在每个场景落地的过程中,这些细节问题都需要耗费更多精力去解决。这就好比上学,上课的时候有书本就够了。大模型在信息世界里就如同读书,读了很多书后变得很聪明,能够总结出各种道理,也能表达出来。但真正要付诸实践的时候,还是得实实在在地去做。正所谓"行万里路",做事还是需要具备相应的技能。
对于机器人而言,关键就在于如何将技术真正落地?数字世界和物理世界怎样才能实现良好的互動?不同场景下情况各异,有些场景可能相对简单,有些则可能难度更大。
张小珺:信息智能,似乎该去的公司都已经入局了,自动驾驶也是,今天不可能再说我要做一个自动驾驶的公司。
张亚勤:不能一概而论地说信息智能就简单。信息智能领網域同样存在不同方向,也有垂直细分领網域。比如说,有的是做横向发展的,但在这个范畴内,可能又会细分出诸如生成图片,或者帮人编写代码这类垂直场景。
当下,自动驾驶正处于爆发阶段。你看相关的公司如地平线这类做芯片的,正逐步崛起。它们已经迈上新台阶,成功上市,不仅有了产品,还能提供服务,大众也开始认可它们。
未来5年,这些公司有着广阔的发展前景。不过,要做好任何一个项目,确实都需要相当长的时间,1-2年通常难以达成目标。就机器人领網域而言,尤其是人形机器人,目前在做的公司,可能要八年甚至10年之后才能有所成果。
我之所以说物理世界的通用人工智能(AGI)会在10年内实现,是因为我认为到那时,AGI将成为主流趋势。
张小珺:做自动驾驶的车企直接开始做机器人会更容易吗?
张亚勤:里面很多共性,最后可能还是看你怎么落地。
机器人整体来讲,要稍微更复杂一些,需要的东西更多。但做无人驾驶是需要更精准一些,因为比如说有的机器人它速度很慢,它比如随便讲做早餐吧。做早餐,它整个速度慢点、快点没关系,但你开车不行的,开车你在多少这个毫秒中犯错就不行了,它的实际需求和要求不一样。所以每个场景的技术也不太一样。
但这里面后台东西都是一样的。首先你需要一个感知模型,你要感知环境,你要理解,你要有action——vision、language和action(VLA模型),这个model还是有的。
生物智能:
拓展大腦,延长寿命,诞生新物种
张小珺:再往后,生物智能呢?
张亚勤:生物智能的实现需要更长时间,因为生物智能需要通过或者植入或者非植入的方式,把我们的大腦和机器连在一块。
我更看好非植入的,看好用更好的、更敏感的传感器,包括一些机器和大腦的接口,新的技术发展很快。
张小珺:我们能在有生之年看到吗?
张亚勤:可以看到,我认为20年之内可以实现。到那个时候,我们人类的大腦将得到全方位的拓展。
大腦的拓展体现在多个维度上。首先,在记忆方面,我们将拥有近乎无限的存储能力。这意味着,很多事情我们无需再依靠自身有限的记忆去记住,存储设备能够帮我们记录下海量信息,极大地减轻了大腦的记忆负担。
其次,智能化发展会让我们变得更加聪明。最初,它可能更多地应用于医疗健康领網域。例如,对于盲人,相关技术可以通过刺激对应的神经细胞,帮助他们恢复一定的视觉能力;对于聋人,能够刺激听觉神经,改善听力;针对残疾人,还能尝试连通并修复受损的神经以及大腦中枢神经,助力他们恢复部分身体机能。
不仅如此,像老年人常患的阿兹海默症,以及小孩的多动症、自闭症等病症,也可能借助这些技术得到有效的治疗或改善。
随着技术的不断发展,其作用将不仅仅局限于医疗康复,后续还能够拓展正常人的智能。不过,要实现这一系列的发展,需要漫长的时间与持续的技术积累。
在这个过程中,我们不可避免地会面临一些问题。一方面,伦理道德问题会逐渐凸显,比如如何确保技术应用的公平性、安全性以及对人类尊严的尊重等。
另一方面,还会涉及到未来硅基生命(以硅为基础的智能机器)与碳基生命(人类等以碳为基础的生命形式)如何共存的问题。因为这些技术不再是与人类无关的外在事物,而是会与人类更加紧密地连接在一起,深刻影响人类的生活与发展。
张小珺:我们有可能在有生之年把自己的生命留给硅基世界,对吗?
张亚勤:这是有可能的。这里面既包含哲学层面的思考,也涉及到信仰范畴的问题,我坚信这种可能性是存在的。
就目前而言,我并不觉得人工智能已经能够产生意识。然而,我认为硅基生命与碳基生命相互连接是切实可行的。通过这种连接,有望让人类变得更加聪慧、更加健康,并且延长人类的寿命。
是不是会永生我不知道。但是肯定寿命会更长。
张小珺:寿命长是硅基的长,不是碳基的长?
张亚勤:它可以延长碳基生命。
张小珺:这是怎么做到的?
张亚勤:比如说,未来或许我们的器官都能够进行替换,大腦也能通过各种技术手段变得更为健康。当下,许多人离世是因为癌症,还有老年期的精神疾病等这些老年病症。但我坚信,假以时日,不管是依靠药物治疗,还是借助其他先进的医疗技术,这些疾病都有被治愈的可能。
不过,对于人工智能会自行产生自我意识,或是所谓全新的灵魂,我对此持否定态度。
张小珺:为什么你不相信?——它聪明到一定程度,不应该能产生意识吗?
张亚勤:因为人类意识是如何产生的,我们都不知道,因此我认为这更多是信仰问题。
但我们现在人已经有意识了,我们加了个东西,对吧?这个东西让我们变得更聪明、更健康、生命更长,这个是有可能的。
张小珺:去年我采访以太坊的联合创始人VitalikButerin,他讲了一个观点挺有意思。他说未来生物和硅的技术会合并在一起。他认为这是我们人类唯一可以参与的Super-intelligence(超级智能)。否则,就是一个单独的计算机,比我们都聪明,主宰这个世界。
张亚勤:这是另一个话题了。我想说的是,未来将会实现数字、物理与生物的融合,并且硅基和碳基也定会走向融合。但具有意识的,依旧是我们碳基生命。
这是目前我们对碳基意识的理解。就硅基而言,即便拥有再多的算力与海量的数据,本质上与意识并无关联。或者说,我们无法创造出自己尚未理解的事物,亦或是对于不了解的东西,我们无从创造。
到底未来人类会怎么样?我认为未来会有一个新的物种。这个新物种虽仍处于人类的掌控之下,但其智能化程度极高,能力也极为强大。它将是人类的一种延伸,然而终究是一个全新的物种。
回顾3万年前的人类,你会觉得那和现在的人类是同一物种吗?我觉得差异极大。3万年前的山顶洞人,属于猿人阶段,那时人类虽已开始使用工具,石器时代也有了火,但工具极为原始。如今,我们拥有手机、电腦与互联网。倘若再过100年,后人看我们现今的手机、互联网以及个人电腦,或许就如同我们看待3万年前的火与石器一般。而且,这种进化的速度正变得愈发迅速。
人类的进化速度相当有趣。从狩猎时代步入农业社会后,在这2000-3000年间,人类整体的生活方式并无太大改变。但我认为,真正意义上的重大变革发生在过去的300年间,也就是工业革命之后。首先,人类掌握了能源,从而获得了强大的动力。其次,信息社会的到来,又带来了另一次巨大转变。而现在,人类正经历着智力的快速拓展。
所以说,自蒸汽机诞生之后,人类的进化便不再遵循达尔文所描述的自然进化模式。如今的进化是非线性的,呈现出指数型增长,速度迅猛。故而我觉得,或许只需30年,至多100年,那时再看今天的人类,当下的这些事物都会显得极为简单。
到那时,新的物种会比现在的人类聪慧得多。但它依旧由人类掌控,受我们的意识支配。
张小珺:它是硅和碳结合的,它可能不是只是碳?因为靠碳基我觉得很难实现30年更换一个物种。
张亚勤:这就得看你如何定义"物种"了。就好比如今你看猿人,会思考他们算不算新物种呢?其实从某种角度讲算,可又和我们现在的人类截然不同,对吧?
如今时代发展迅速,不需要像过去那样历经3万年,也许短短30年,最多100年,就会演变出一种全新的形态。
张小珺:能不能构想一下10年后我们的社会会是什么样?
张亚勤:10年之后,我们现在想象的好多东西实现就实现了,路上就会很多车就是无人的了,对吧?
会看到很多车无人驾驶的汽车,很多机器人。选择亲自开车的人会大幅减少,不少人会摒弃自行驾车的方式。
就像现在,大城市里的很多年轻人就选择不买车,他们觉得使用优步出行更为便捷。到那时,或许更多人会选择不再自己开车。
30年之后你看到有个人开车,像现在有人开马车一样,变成新奇的东西了。你现在去纽约,纽约现在还有马车,你去看纽约赶个马车挺新奇的。
30年之后,你看到个人开车就是这样的。以后可能人开车需要特殊批准。30年前电梯里面还要坐人的,有人帮你运营的,现在你看电梯里有没有人?没有人,但我后来发现在英国电梯,它对于这种服务,你看上去就很新鲜的这种。
张小珺:这是一个高端服务。
张亚勤:没错,所以到最后,亲自开车说不定反而会变成一种极为特殊的场景。
可以预见,会有大量机器人真正走进千家万户。我想,每个家庭都会拥有一个机器人,就如同如今冰箱、电视一样普及。这种机器人能够承担起家庭安保职责,当你不在家时,它可以查看窗户是否关好,留意是否有外人闯入。
张小珺:可能以后买车的钱就花在买机器人上,是吗?
张亚勤:对。我觉得这些都会实现的,包括教育、医疗等领網域也都会有彻底改变。AIR现在就在做AIHospital无人医院。
我们当下所做的诸多尝试,未来大多会变为现实。
不过,人类自身并不会发生根本性的转变。我预计,30年后人类的寿命将会大幅延长。30年的时间,虽不太可能实现永生,但活到100岁或许会成为普遍现象,甚至有些人能够活到120岁,乃至150岁。
张小珺:这会带来社会结构性的变化吗?能推演吗?
张亚勤:这一点我虽无法确切预知,但我认为它必将引发社会结构的一些变化。
比如说,未来人们的工作时长会越来越短。在工业革命刚刚结束的时候,我们每周要工作7天,后来变成了6天。我出国那段时间,国内还是每周工作6天,等回来就变成5天了。现在欧洲一些地方已经实行每周工作4天,照这样发展下去,以后人们说不定一周只需工作1天。
一周仅工作1天,其余时间人们就可以去做自己感兴趣的事。这里要说明的是,这并非意味着部分人工作7天,而其他人失业,致使6个人没工作。
我的意思是,随着社会生产力的大幅提升,社会结构发生改变,人类社会会步入老龄化,人均寿命增长,自然出生率则会降低。由于人均寿命延长,人口总数可能不会减少,但新生儿数量会下降,这已然成为一种大趋势。
留意观察,你会发现相对发达的国家人口都在呈减少态势。目前人类的平均寿命中位数大概是多少呢?现在是40岁,而以后可能会达到80岁。所以到那时,80岁的人或许还算是青年人或壮年人,一切都会发生改变。
并且,未来老年人的身体状况可能也会相当良好,因为不管是身体上的疾病,还是腦部的疾病,都会逐渐被攻克治愈。
张小珺:所以,应该尽早找到自己喜欢干的事,要不然怎么度过这么漫长的人生。
你会给现在的年轻人什么样的建议吗?你会告诉他们现在科技发生了什么样的变化,教育会发生什么样的变化,你们应该怎么应对?
张亚勤:我提议,今后每堂课除了配备一位人类教授,还应增设一位AI教授。这位AI教授就如同助手一般,但它所掌握的知识或许远比人类教授更为丰富。学生不仅能够与它互动交流,还能向它请教问题。在未来,学习的关键方式并非死记硬背或大量刷题,而是学会如何提出高质量的问题。
就拿现在的ChatGPT来说,它给出的回答质量,与你提问的水平紧密相关。要是你随意提问,它可能就敷衍作答。但要是你问得精妙,它便会给出深入的回答,与你展开有深度的互動。
一直以来,我们都在强调提问的能力,倡导批判性学习,鼓励学生进行辩论,形成自己独特的新观点,而这些在未来会变得愈发重要。
张小珺:最后,基于你所有读过的书,能不能推荐两本书?
张亚勤:我刚看了一本书叫《Outlive》(《超越百岁:长寿的科学与艺术》),我觉得特别好。刚才我们提到了AI在生命科学领網域的应用,这本书就涉及到长寿生活方式的相关内容。
之前我还读过一本老书,叫《InSearchofMemory》(《追寻记忆的痕迹》),讲的也是相关主题。我还专门向这本书的作者,诺贝尔奖得主哥伦比亚EricKandel教授请教过,那位老先生如今人在美国,已经100岁高龄了。在人类所具备的各种智能当中,记忆力占据着极为重要的位置。
记忆抽成几个层次,有天生DNA的记忆,有短期的记忆,有长期的记忆。学习的过程,实际上就是如何将知识转化为记忆的过程。比如知识,要存储到大腦外皮层形成长期记忆,才算是真正掌握了知识。目前,AI在这方面的理解还很欠缺。这本书对人类如何记忆以及AI对知识的抽象化处理,阐述得十分精妙。
例如,患上失忆症,或者阿尔茨海默病、亨廷顿病等的老年人,往往会发现他们大腦中负责记忆的区網域,像海马体开始缩小、萎缩。一旦出现这种情况,人的所谓智能就会随之减退。
可见,记忆体尤为关键,然而目前AI在记忆方面的表现仍不尽人意。