今天小编分享的教育经验:韦青:远取诸物,近取诸身,则近AI之道矣,欢迎阅读。
"风生于地,起于青萍之末",什么是这个时代的"青萍之末"?
"我总是滑向冰球即将到达的下一个位置",信息文明时代,哪里是冰球即将到达的下一个位置?
"过了这个村,就没这个店了",这真的符合创新的第一性原理吗?
今天,韦青老师再次讲述新人机时代的生存与发展之道,拥抱这个时代的不确定性,赋予智能机器以人类的主观能动性,在它们的帮助下应对因连接而高度复杂的人类社会。向机器学习,与混沌为伍。
以下为课程笔记:(篇幅所限,文章内容仅为部分课程内容,请前往混沌APP看完整课程)
授课老师丨韦青 工程师、技术官
编辑丨混沌商业研究团队
支持丨混沌前沿课
青萍之末
亚马逊雨林中的一只蝴蝶振动一下翅膀,就可能引发美国得克萨斯州的一场龙卷风。然而,当我们看到飓风来临时,游戏其实已经结束了。"夫风生于地,起于青萍之末",我们应当构建出根据"青萍之末"判断"风生"的能力。
严格意义上,你可以把这种能力说成是概率性的规律总结,它可以帮助人类察觉很多以往无法察觉的"青萍之末",而这恰恰是机器擅长、人不擅长的。既然是概率性模型就一定会有错误,当你接受了世界是不确定的,接受了你永远会犯错误,你只需要关注如何少犯错误。把这些思维整合在一起,我们就有可能成为机器的主人。如果人类过分自大,认为自己不犯错误,那就会丧失让机器的算法能力强化我们的机会。狂奔的技术,需要相应的文明与制度的驾驭。无论何种长技,都需要相应的人才发扬光大。
人类社会因连接而复杂。通讯就是这个时代的"青萍之末",5G、6G卫星网络全部连接之后,这个世界不可避免地会成为地球村,我们的精力、财力、时间都被通讯连接起来。假设有十个人交换意见,如果彼此单点交叉,差不多有九十种可能。如果彼此实时互联,就有2的90次方种可能。
这种复杂性是不可能被人类个体在没有外力帮助的前提下自己应对,也不可能单单依靠人类群体的能力解决,我们已经因为技术的进步不知不觉、不以人类意志为转移地进入了一个确定性因复杂而消失的时代。我们要习惯这种不确定性,与混沌为伍,利用这种现象打造新的可能性,变成一个无限游戏往下演绎。我们要珍惜彼此间不同意见相碰撞的机会,只有这种碰撞才能打开一个我们都不知道的局面。头腦、资金、数据、知识,各个领網域的洞见凑到一起,看看未来到底是怎么回事。
人类社会又因实时连接而失控。信息本身就是模因,它自己也在寻找生存的空间和机会,它会利用人的思想作为模因的载体。原来联结没有建立起来的时候,模因的自复制和传播是短暂的,但由于现在是实时互联,模因也开始进行突变,可能一下子就传开了。
从老死不相往来到现在鸡犬之声相闻,就会形成一种流通和共振。这种共振的力量非常强大,如果用好了,就是一个摧枯拉朽的力量。如果用不好,或者被别人利用了,也将是一个毁灭性的力量。这实际上就是网络效应,因为互联而形成的一种必然的社会现象。
那么,我们有没有准备好应对这种时代?我们要明白,这个时代的信息是"比真还真"的。我们现在看到的绝大多数信息,都是电腦、电视、手机上的像素构成的。当我们还在相信由像素产生的信息时,有没有考虑过这种像素产生的信息恰恰是机器最容易形成的。如果不理解这一点,什么都相信的话,实际上是很危险的。
信息就是用来改变人的思想的,如果有信息说服我们说,未来物理世界不复存在,每个人都将生活在虚拟世界里,而你不加审辨地听信,那么人的思想一旦改变,你对物质世界的感知也会变化,这是认知心理学早已证明的。如果我们不具备一定的抵御能力和审辨能力,我们该怎么去理解这个信息世界?
大家看过很多新闻,谁能够百分百地确信那些事情是真实发生的?我相信现在还没有恶劣到那种程度,大概率这些所谓的信息确实发生着,因为还有很多公共媒体的验证。如果越来越多的媒体使用机器涌现产生的信息,我们如何保证自己能够不中毒?要如何为自己的思想戴一个N95口罩?
《让子弹飞》中黄四郎最后能够被消灭,是因为张麻子把黄四郎的替身给砍头了,让鹅城的百姓看到以为黄四郎死了。实际上黄四郎没死,但他的信息被证明死了,所以他就死了。这就是信息社会的特征。大家要知道,人是多么容易被其看到的图景和听到的故事所欺骗。
这时候还能再靠人腦抵御信息的迅速流转吗?这是不可能的。Satya(萨蒂亚·纳德拉)常常引用的一句道格拉斯·恩格尔巴特所述:"应对复杂性和紧迫性的能力是衡量人类组织与制度的标准,但是复杂性和紧迫性已经超越了人类可以应付的程度。"我们要用技术手段帮助人类应对这种复杂性的挑战。人工智能的作用绝不仅是生成文字、图片或视频,它可以帮助我们应对信息时代的所有挑战。
篇幅所限,本文内容仅为课程十分之一
点击海报,看完整课程!
趋势:"冰球的下一个位置"
2007年iPhone上市,愤怒的小鸟这款游戏应该是2008年到2012年之间安装头几位的应用,还有一部为它拍的电影,绝对是一个现象级的产品。十五年前,那些程式员和用户认为,iPhone或智能手机就是用来玩愤怒的小鸟的,现在这个应用已经没有人安装了,但我们会认为手机没有前途了吗?手机已经融入到我们生活中的方方面面。
此时此刻此景,地球上的某一处也许会有另一个现象级情况出现,就像愤怒的小鸟一样,如果错过了,你会不会觉得就没有前途了呢?现在我们知道不会,但在那个氛围下,每个人都想去做愤怒的小鸟和它的衍生品。
乔布斯说:"有一句韦恩·格雷茨基说的话我很喜欢,‘我总是滑向冰球即将到达的下一个位置,而不是它现在的位置’。在苹果,我们一直努力做到这一点。从一开始就是这样,未来也一直会这样"。2007年苹果发布会结束后,就正式开启了iPhone时刻。我们是否能对冰球即将到的位置、世界即将到来的时刻有一定的判断呢?
在科技界有一个曲线叫做"技术炒作(信仰)曲线"。外人没有从头经历过其它行业中早期不为外人道的探索与彷徨,其中也包括很多革命性现象;由于看不到原来发生了什么,只看到了出水的那一刻,于是认为事情永远都是这种惊天动地的走势,"孙猴子突然从石头中蹦出来",所以就会有红色箭头这种方向性的模型预判,这也被戏称为"吹牛曲线",其实是英文Hype cycle的原意。而行业里的人有着尚未跃出水面的这段经历,就会明白黄线是其本质,倾向于做出绿色趋势的判断。如果人心、市场或资金出了问题,比如很多资金由于没有及时止损,砸在里面了,就变成了蓝色的这条趋势。信息时代你要从"言-行"和"效-果"两个方面、四个维度来判断是炒作还是正常,结果是什么,如果没什么结果,就少费点钱,少费点精力。
应对时代我们还是要创新,或者说创变。其实创新从逻辑上来讲不够完备,它讲的是从旧到新,中间有个过程没说。而"变"有一定概率是要失败的,有很多次失败才会由新到旧。
什么是创新(创变)的第一性原理?有的科技树可以长到200层,很多时候我们都是被直升机直接送到技术树的一个分杈上,直接到了100层,但是这个分杈可能最高也就101层,这就陷入到了本地最优解。那么如何破这个局呢?这时候我们就要回到原点,往下走看看这颗树到底怎么长的。就像爬山一样,走着走着发现没路了,为了达到更高的地方,还得再下山,找别的路上山,因为可能性越往根部越大。
回到原点后又开始了人类新一轮的信息文明,可能需要花几百年,才对当初用智能机器解脱人类负担的愿景有一个初步的交代。再往下走可能还是会走偏,走不到全局最优解,没关系,随时纠错,再退回来一点,找到全局最优解。
这是一个循环迭代的过程。比方现在这一轮大语言模型,如果还是靠堆算例、堆数据,大概率到了一个平台期,但不是说它没有前途了,而是要重新回到人类的诉求上,再来一遍。用这种想法来看,绝对不存在"过了这个村就没这个店了"的道理。如果你愿意回到树根,就一定能长出新的杈来。
那么,我们有没有这样的技术信心和技术信仰?我所知道的OpenAI、微软、谷歌、苹果、Facebook、华为、联想、阿里、腾讯、百度、京东等等这些公司,一定都是有技术信仰的。成功除了有能力以外,坚持也很重要,坚持源自信心,信心源自信仰。如果这个信仰很轻易地就被动摇了,那么失败就是大概率事件。
落 地
微软对自己的定位是生产力和平台公司。原来是以Windows为平台,现在是指智能云平台。生产力就是减轻人的负担,帮助人更高效地干活。因此,对于微软来讲,如果不解决生产力的问题,是没有人会投入资源去做产品开发的。去年二月,微软推出了和Bing结合的GPT服务。虽然说有了新的宝刀,但大家却没有被这个工具迷惑住,工程师们考虑的还是我的痛点是什么?我要解决什么问题?
这些微软工程师的心路历程都是一样的。其实一开始谁都是懵的,有兴奋、迷茫、徘徊、犹豫、质疑,这就是人的认知过程。没得选,但谁都在摸索。科技行业是一个专制不服的实证行业,实践是检验真理的唯一标准,人家把活做出来了,比你高效,比你便宜,比你的用户满意度高,那么你再说它不行都没用。但有时候在没有被实证之前需要有信心,就像萨蒂亚早期决定投OpenAI的时候,没有什么证明,就是靠信心支持的。
在巨变的科技行业,真正的心法、秘诀是你信不信这件事能成。当所有人都说不能成的时候,当你知道有极大概率被证明是错误的时候,你愿不愿意往下走?因此,要想在科技行业成功是很不容易的,需要成熟的心智,稳定的心态,需要坚强、毅力和韧性。
因此,先别急着定目标,方向差不多就下水吧。原来不是大模型,是人的进步和生态的培养。某种意义来讲,人们需要的不是ChatGPT这个工具,需要的是解决他们的问题。模型不能当饭吃,得把活干了,干活的时候,什么趁手用什么,再厉害的工具,没有用就是没用,再普通的工具,有用就是有用。真有那么多新东西吗?其实没有什么奇迹,全是信仰和坚持。
2022年5月,微软董事长和CEO萨蒂亚 在微软一年一度的Build大会上提到的GPT、OpenAI、Copilot等等当下的热词。我也经常反思,为什么2022年5月我看到这个视频却不知道这些将会成为现象级的事物,如果我现在仍然以目前的思维逻辑,会不会在追新的狂热中再次错失下一轮进步?
下一次我们是见证者、旁观者、追随者,还是开路者、参与者、贡献者呢?预测未来的最佳方式是创造未来,创造未来的有效方式是躬亲力行。我希望咱们学的过程不要站在岸上,要下水学,下水学习可能有点风险,因为结果是不确定的,所以要学会拥抱不确定性,同时对自己有坚定的信心,觉得我就是行,然后勇往直前。行的基础是认为自己永远会犯错,锻炼的是知错和改错的能力。
刚才提到了我们需要机器帮助我们应对这个世界的复杂性。那么有了算力,问题就全解决了吗?Ilya Sutskever说了两个需要注意的点。第一,别人没有的数据。机器会学习的前提是需要被人类以数据进行教导,只有拥有了别人没有的数据才能教出一个符合你要求的机器出来。第二,以发展的眼光考虑发展。有一万种理由可以说现在的技术不成熟,但是技术演绎的速度非常快,智能机器已经产生反馈能力了,特别擅长纠正自己的错误,我们用多模态、多模型、多轮的方式让它们自己纠偏就够了。同时,智能机器可以不断地仿真遍历(也是萨提亚说的Enumeration of simulation),把人们认知圈内所有的可能性遍历一遍,大概率就可以解决人们的问题了。如果遍历出几亿种可能性都无法解决的问题,那个点恰恰就是人类需要突破的地方。
建 议
建议一:知识的力量
在信息社会,知识既是力量,也是权力。数据既有风险,也有影响力。你在有知识的同时,还要有能力用数据去影响别人的知识,甚至是"沾染"别人的知识。
模因的传播跟病毒是一样的,很难靠物理方式拦截,一旦附着在某个能产生共鸣的有机体上,它就开始渗透传播。因此,在知识领網域,单单分享数据本身就是一种竞争方式。
在工业时代,东西的保值能力很强,存在自己的仓库里就行。而在信息文明时代,知识不用就不值钱。那么,数据该不该保护?必须要保护,但在有能力保护数据的情况下,知识一年后就丧失了它的先进性,就没价值了,那怎么办?分密级之后迅速把所有能分享的数据向全人类开放分享出去,这是信息时代中任何文明不被放入历史博物馆中的唯一方式。
这就要把你的知识进行分类。你有多少不能放出去的专有知识?据我观察,任何一个公司或组织,绝对不能让外人看的数据不超过20%,甚至可能不超过10%,剩下的百分之八九十都是可以发散出去影响行业标准、文化习惯、人类社会价值观的通用知识。只有在信息文明时代才可以靠分享影响人类的思维方式。
还有一种知识叫做领網域知识。这个领網域包括公司、行业、民族、国家。每一个领網域都要知道哪些数据是需要分享出去的,让未来的地球知识体系占一份你的味道。比如技术行业,开源既是一种分享,也是一种参与,更是一种影响和促进。
上一世纪五十年代,人工智能概念初始发端,诺伯特·维纳在《人有人的作用》一书中特意在告诫当时趋于信息保守的行政体制"在变动不居的世界中,能把信息储藏起来,而不使其严重地贬值,这种想法是荒诞的。信息更重要的是流通"。咱们都是从农业社会、工业社会过来的,不可避免地带有成长过程中各种文明范式的影响。因此,我们要小心,要随时通过反馈的方式告诉自己,信息文明该怎样生存和发展。
在机器"以数据为食"的时代,需要具备数据能力、知识丰度、文明贡献和文化影响。数据能力既要满足数据合规的要求,也要提升数据管理、利用与分享的能力。知识丰度是指多样性的数据形成多元化的知识。文明贡献是指,知识生成与分享的程度决定了对人类文明的影响力与领导力。文化影响则是数据的有效分享产生对社会文化的有效影响。
数据管理的本质是不能分享的绝不分享,能够分享的必须分享。数据生成、管理、应用与分享的实力决定了各个民族、国家、机构与个人的全球影响力。
建议二:流程的挖掘
在信息文明的时代,所有的决策都会依据知识而做出判断,因为流程而被实现。无论做什么事情,都是从A点到B点,中间有很多变量。我把人要做的事情标记为红色,机器帮我们做的事情标记为蓝色。从早上睁眼起床到晚上闭眼睡觉,我们要用电饭煲、咖啡机、手机、电腦、汽车,机器在知识的积淀和流程的执行上面有很多先天的优势,咱们已经进入了一个人和工具无缝结合的状态。
没有数字化,也不会有智能化。你会发现数字化改革,人才、组织、流程、产品和产业链缺一不可。
·人才(转型-纳新-代谢)
人才应当具备成长型思维,思想解放,愿意接受新鲜事物,尤其是目前还不成熟的新鲜事物。当一件事已被证明百分百能成的时候还轮得到你吗?所有的成功人士都是在成功率为百分之六十的时候按下按钮。
·组织(改造-适配)
根据康威定律,一个系统化组织所开发的产品与服务必定带有该组织的部门分割属性。而逆康威定律则尝试描述如何利用技术反向影响分割孤立的部门墙局限。组织中有部门墙会导致数据流通不畅,好多没下水的组织会尝试把部门墙打碎,但是有人在的地方就有江湖,很多公司刚打破一个部门墙,又建立起一个新部门墙。在数字化真正到位的组织,各个部门可以有自己的方法,甚至自己的语言,但是每一个部门或个体都是一个在数字化系统中以API方式输入输出的服务单元。在企业平台层面只能有一种数据和接口标准,但允许每个部门内部独立,要求对外的任务输入和能力输出以API的方式开放,通过标准化的输入输出接口协同工作。通过技术本身的能力应对部门墙,而不是打碎部门墙,在包容多样性的前提下实现"书同文,车同轨,行同伦"。
·流程(优化-再造-建模)
十几年前Web3.0就存在了,那时它的目标是达到"人能理解,机器能处理"。早期Tim Berners Lee这批前辈们发现光有檔案网络服务还不够,要建立一个知识和数据的网络,用一个资源描述框架把人世间的各种现象描述出来,做到人能理解,机器能处理。
·产品/服务(赋能-反馈-定制)
为了应对越来越复杂的社会与用户需求,未来的产品和服务都需要一种可以实时反馈的信号进行纠偏,这既有数据安全和隐私保护的挑战,同时又有实时反应的先进性,核心还是数据分级和治理的能力和执行力,既不能因强大而滥用,也不能因数据治理的懒政而一刀切的封闭。由于都是新生事物,还是一个"认错-知错-改错"的纠偏前行过程。
·产业生态链(优化-纳新-重构)
开源为什么那么重要?因为你的技术再先进,别人不用你的,就没有用。信息文明时代知识的价值取决于别人愿不愿意用你的东西。API将会是信息文明时代能力表征的语言方式,你把你的API分享出去并且被大家所接受,你会发现世界就跟着你的习惯前行了。
为了智能化而进行的数字化转型产生的数据,才是真正为信息文明而生的数据,从中才能最高效地提炼出人类能理解、机器能处理的知识,再到Copilot作为智能助理。有些人纠结到底是Copilot还是Autopilot,我认为只要是以人类目标为目标,决策与行动链中人类保留一票否决权的机器功能,就是Copilot。因此真正的问题是有人类设计出来的机器机制中有没有"人在决策/行动链中"(Human-in-the-loop)和"人在机器优化/改进链中"(Human-on-the-loop)。
什么是加法逻辑?什么是乘法逻辑?有技术是加法逻辑,但有作用一定是乘法逻辑。一旦把技术内化,融入到每一个环节、步骤、流程,它就是一个乘法概念。萨蒂亚经常说,模型不是产品,模型可以成为产品的一部分。当模型内嵌到用户体验产品的每一个环节之中时,模型就有用了,而模型一旦有用,就变成了产品的一部分。
执法依据流程,流程重在执行。人擅长创建流程,也擅长破坏流程,但不擅长遵守与受制于流程。而机器擅长严格遵守与执行流程,也擅长通过反馈学习以优化流程,但不擅长创建流程。在人机协同的时代,人干人的事,机干机的事,最终我们一定能让自己的智慧更新。
建议三:落地的次第
技术平台的成熟度也遵循着有,用和有作用的逻辑。一般来说,都是先要拥有技术,而有能力彻底改变一个社会运作范式类型的产品或服务的一个特点是,需要全社会都使用它,它才有作用。比如今天咱们总是谈ChatGPT,实际上在当前这个时代,这种以大语言模型为基础的人工智能的使用率是极低的,大部分人都没有在用,就算有些人用了也只是浅尝辄止。为什么呢?因为它必须是在你工作、学习、生活方式改变的情况下才能起到作用。模型是没有用的,它必须要成为你产品的一部分。
我们一定不能陷入"过了这个村就没这个店了"的想法,我们要时刻看着自己,利用新能力改造自己的流程和行为范式,进行基础建构,形成核心竞争力。首先是"有",具备这个能力。接下来,开始通过培训、流程再造等进行赋能,这就是"用"。数据生成到这一步,大部分人就开始意识到,以显卡为代表的算力只是一个必要条件,还得有数据、人才、场景,那么就看哪一家能看得比较远,能够把目标看清楚,最终还是要"泛在"。
这类技术现象级的产品不会经常出现。我觉得"电"算一个,"互联网"算一个,这一轮"人工智能"算一个。电花了一百多年才到完全完备,互联网从一九六几年算起,到现在也差不多六十多年。原来我的一个老总说,在业务中,尤其是搞技术、搞軟體的,特别容易忽略物理性的局限。人们倾向于关注如何拥有某种技术能力,但不要忘记在拥有技术能力之后还有漫长的学习与适应的过程与投入,而真正起作用,xuyaodengdao整个社会型态与文化习惯与技术能力相匹配。"想到"、"听到"跟"做到"、"做得让用户满意"之间差距是巨大的。
我曾经分析过一些国家的GDP数据,能源、电力等社会关键基础设施的应用和能力不过就占整个社会GDP的百分之十以内,但而且最后一般都发展成国家拥有,因为它太重要了,重要到不可以纯粹以商业的想法来评估它。不是说不去做关键的基础设施,只是越关键基础的东西,耗时越久,你要做好坐三十年冷板凳的准备。
其实这三个环节没有一个是容易的,关键还是在于你适合什么样的业务方式、生活方式、工作方式以及逻辑方式,然后再选择适合自己的。希望大家能成为剧烈动荡时代中技术的主人,而不是被它牵着到处跑。
在落地的时候,大部分公司专注于有,就是买技术、买产品、买设备,实际上第二步培训和流程再造是非常困难的工作。公司的决策者一定要知道,你花了100块去买一个能力的时候,最好还要准备另外100块让你的机构能够享受到它的好处。第三步就是让你的客户能够接受。知道这个客观规律之后,我们就可以知道这是小马过江还是小马过海,从而在精力投入、资金投入和回报期望上,能够比较理性一点。
技术真正做深了之后,必谈你的技术信仰,你到底为什么做技术。比方说我就一直说我是工程师,是一个Maker,一个Builder,我的人生观、价值观就是以造物为享受。你的初心是什么?你的人生使命是靠"面子"就能活,拥有一个技术去评个奖就搁置一边了,还是不管怎样一定把这"里子"拿到,要实现技术为人类社会增添福祉为终身追求,或者既要有"面子",也得有"里子",这也是技术选择的不同取向。我觉得,在当下的时代,无论是面子、里子,咱们都别耽误了,但始终别忘记,大众要咱们贡献的是"里子"。
建议四 智能的本质
远取诸物,近取诸身,则近AI之道矣。学过认知神经科学的人就比较熟悉了,人工智能的那些用语大多是从认知神经科学借过来的。比如说短时记忆,短时记忆可能只能维持几秒钟,但是非常高效。又说记忆存在于神经细胞之间的连接中。短时记忆和长期记忆先要跟输入进来的信号做比对,比对完的高低就是一种判断,接着进行推理,就是跟你过去的记忆做对比,一步步往下走。明白这些的话,就能知道其实人的基础构型也是二进制的,只不过这种二进制的实现极其复杂,不仅仅是电腦那种硬性的开和关,更像是量子计算那种开和关以及又是开又是关。
在判断、推理、规划完之后,就产生行动,之后再产生一种结果,这结果再反馈回来,跟原来接受的信号进行比对,知道你下一步该怎么办。
人类有目的,机器有能力,它就根据人的要求把事儿给做了,基于这个结果,人还会再反馈给机器,告诉它下次还可以做得更好。这也是机器本身不断纠偏、优化、完善的流程,这就叫做强化学习模型。
我对这个模型做了一个微小的调整,给它加了一个更大的环境,一定是跟环境不断互动交流,才能形成一个智能体。它的基本范式是智能机在一个环境中,并且产生了一些互動关系,再通过观察外部状态,学习比对数据,形成一个结果。数字化的目的就是让你知道每一分每一秒你离你的目标差多少。
把这几个系统综合就是I-P-O-F,这是系统工程的一种元模型。输入一个目的,对长期记忆中的知识进行思考以形成理解、推理、规划,再通过人体与工具组合的行动输出一个结果,最后将输出结果反馈至输入,不断纠偏完善。
微软开源了一个大语言模型开发框架,称为Semantic Kernel,非程式员初看可能有点复杂,但实际上你是不用去管内核的,你只需要知道把你的提问放进去,期待有个结果就够了。最多你把你的判断返回给提问,让它不断纠偏,这恰恰是提示词工程建议大家做的,就是不断提问,多问几轮。一旦明白I-P-O-F这个不断循环的过程,你就能够大致体会怎么去和机器打交道,你怎样嵌入到机器的I-P-O-F中,你怎么让机器嵌入到你自己作为人类的I-P-O-F中。
大家有没有这种体会?准备让员工去干活,但是想了想算了,自己干吧,自己干得快得多,但是如果有100个这样的活让你干呢?你还是得交出去。机器也是一样,它一开始一定没有你做得好,那你有没有这样的信心、耐心和决心在未来五到十年训练出一个可以分身的孙悟空,帮你应付信息时代的挑战?
早期人类文明什么都没有,后来有了工具。再后来形成集群,进入农业文明。之后又进入工业文明,人们越来越聚集,知识越来越可重复,工具越来越复杂。再往下走就是信息时代,自动化程度更高,出现了互联网、移动互联网、人工智能、大语言模型服务以及多模态、多模型和智能体集群。未来冰球要滑到哪里?我们应该锻炼一下这种想象力,不能因为我们跟在冰球后面就认为它没有规律,它是具有概率性规律的,我们要发挥人的主观能动性来进行判断。
Agent意为做、行动,引申为智能体。以AutoGen智能体为例,是有很多Agent集群干一件事。在AutoGen的论文中举了一个例子,首先,有一个负责总筹划的指挥员,如果现在要写一个东西,该怎么做?你就来分配任务,术业有专攻,我告诉你我的目标,你来写这个东西,之后我再交给Safeguard审核一下,这个过程不断迭代、优化、完善,直到满足人类的需要,其中最大的特点就是"人会做的机器觉得难,机器会做的人类觉得难"。找到双方的优劣,取长补短就是了。
Agency意为行动的状态或能力,引申为能动性。一个智能体如果具备主观能动性,那这种能动性一定是人赋予的。知道这个道理我们就明白了,我们更要去分享我们的知识、习惯,否则智能体的主观能动性就是别人赋予的,万一不符合你的价值观和规则,不就吃亏了吗?
这一轮人工智能代表的是一种概率性能力,但千万别忘记机器还有确定性的一面。没有确定性的是人类社会,正是需要机器的确定性来帮助我们应对不确定性的问题,不要以为计算机编程过时了,它具有非常完美的确定性,这种能力远没有过时。
向机器学习
我总结了一下可以向机器学习的三点:初始化、反向传播和梯度下降。初始化的要求就是没有倾向性,可以随时刷新。很多企业决策者不知道该如何决策,如果开始用这种方法,预埋很多数据点,说白了就是可以在小仗中失败一下,目的是知道离目标还有多远,不纠结于犯错,专注于改错,这反而可能是成功的一个保障,因为你一直知道离悬崖边有多远。反向传播就是反馈纠偏,而梯度下降的要义就是不要过早陷入本地最优解,永远留出多样性以期到达全局最优。
由这三点又产生了一些方法论。第一个是Cynefin框架,設定方向,不設定终点。第二个是三错法,从认错到知错再到改错,也可以总结为"奖一错,防二错,罚三错",出错,意味着做事了,要奖励;再错,情有可原;老是犯同样的错,说明没动腦筋,敷衍了事。第三个是三阶法,从How到What再到Why。这是与Why-What-How的演绎法相反的路径,原理是一样的,只不过是归纳法的学习过程。演绎过程说起来容易,做起来难;连接式与行为式的机器学习过程是归纳法的,人类可以从中借鉴到许多本来就是人类学习的优秀范式。人类本来就具备创造性、多样性、不确定性与相应的适应性与主观能动性。只不过由于人类的自大,这种试错法的探索学习方式,被固化思维和闭卷考试的习惯给抹杀了。
别那么着急下结论,也别什么都信。《看不见的大猩猩》的作者去年又写了一本书,叫做《没人是傻瓜》,他在书里说,信息爆炸时代的一个基本生存要义叫做Take less check more,就是少相信一些,多验证一下。在某种极端情况下,我甚至认为它应该是Take nothing check everything。因为信息能够被机器轻松地复制或伪造的话,人们真的需要养成随时验证的习惯。这时就出现了一个悖论,你人类单单靠自己可以随时验证每一条信息吗?要靠魔法打败魔法,人类社会发展至今,没有机器智能作伴的人类是很难生存发展好的。
选好大致方向而不是终点,在行动中缓慢、坚定地纠偏前行。我们能不能稍微改变一下自己的判断分析逻辑,让我们能够敢于下水实证,同时要加一些保护机制,也别淹死了。让机器告诉我们离悬崖边还有多远,训练出自己的一些分身,往前走就完了。至于会怎么样,没人知道,但我们知道,这道门一旦打开,严格意义上应该关不上,所以咱们还不如就拥抱变化,与时俱进。
微软的使命是让地球上的每一个个人和组织成就不凡。这不是口号,而是真实在发生的,根据我的亲身经历,微软的很多工程师、科学家真的是以这个为愿景,而且因为有积极的助力,其产出也会越来越大。
其实,今天我就是把微软工程师从去年开始到现在的亲身经历跟大家又重新演绎了一遍,我坚信每个人都会走这么一个过程,就算不是大语言模型,也会有其它东西。现在这道门是真的打开来了,我们可以选择不理它,我们也可以选择什么都信,我们也可以选择审辨式、批判式地去理解、吸收和改变自己的行为方式,走出一条自己的道路出来。我觉得如果能达到这个目的,就善莫大焉了。